- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
实际的并行插入符取决于 R、插入符和 doMC 软件包。如 Parallelizing Caret code 中所述
有人和我在类似的环境中工作吗? R 插入符并行化正常工作的最大 R 版本是什么?
> sessionInfo()
R version 3.2.1 (2015-06-18)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 14.04.2 LTS
locale:
[1] LC_CTYPE=en_US.UTF-8 LC_NUMERIC=C LC_TIME=C LC_COLLATE=en_US.UTF-8
[5] LC_MONETARY=en_US.UTF-8 LC_MESSAGES=en_US.UTF-8 LC_PAPER=en_US.UTF-8 LC_NAME=C
[9] LC_ADDRESS=C LC_TELEPHONE=C LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C
attached base packages:
[1] parallel stats graphics grDevices utils datasets methods base
other attached packages:
[1] caret_6.0-52 ggplot2_1.0.1 lattice_0.20-31 doMC_1.3.3 iterators_1.0.7 foreach_1.4.2 RStudioAMI_0.2
loaded via a namespace (and not attached):
[1] Rcpp_0.12.1 magrittr_1.5 splines_3.2.1 MASS_7.3-41 munsell_0.4.2 colorspace_1.2-6
[7] minqa_1.2.4 car_2.1-0 stringr_1.0.0 plyr_1.8.3 tools_3.2.1 pbkrtest_0.4-2
[13] nnet_7.3-9 grid_3.2.1 gtable_0.1.2 nlme_3.1-120 mgcv_1.8-6 quantreg_5.19
[19] MatrixModels_0.4-1 gtools_3.5.0 lme4_1.1-9 digest_0.6.8 Matrix_1.2-0 nloptr_1.0.4
[25] reshape2_1.4.1 codetools_0.2-11 stringi_0.5-5 BradleyTerry2_1.0-6 scales_0.3.0 stats4_3.2.1
[31] SparseM_1.7 brglm_0.5-9 proto_0.3-10
更新1: 我的代码如下:
library(doMC) ; registerDoMC(cores=4)
library(caret)
classification_formula <- as.formula(paste("target" ,"~",
paste(names(m_input_data)[!names(m_input_data)=='target'],collapse="+")))
CVfolds <- 2
CVreps <- 5
ma_control <- trainControl(method = "repeatedcv",
number = CVfolds,
repeats = CVreps ,
returnResamp = "final" ,
classProbs = T,
summaryFunction = twoClassSummary,
allowParallel = TRUE,verboseIter = TRUE)
rf_tuneGrid = expand.grid(mtry = seq(2,32, length.out = 6))
rf <- train(classification_formula , data = m_input_data , method = "rf", metric="ROC" ,trControl = ma_control, tuneGrid = rf_tuneGrid , ntree = 101)
更新2: 当我从命令行运行时,只有一个核心正在工作 当我从 Rstudio 运行这些脚本时,并行正在工作,因为我看到 4 通过 top 进行处理。但一秒钟后错误发生了:
Error in names(resamples) <- gsub("^\\.", "", names(resamples)) :
attempt to set an attribute on NULL
更新4:
您好,问题似乎出在已终止的 R session 中。每次启动 AWS 实例时,我都会运行 R 代码,现在刷新 R 引擎。现在,每次刷新 Rstudio 浏览器时,我都会执行 Session -> Restart R 。看来它运行了。我现在正在检查从 Ubuntu 命令行运行脚本是否相同。
一般情况下它会运行而没有完成。插入符号在数据级别上并行。这意味着它能够在不同的进程上处理每个重采样。但如果样本仍然很大(100,000/2(折叠数 = 2)X 2,000 个特征),这对于每个处理器单元来说可能很难完成。我说得对吗?
我认为并行性必须在算法级别。这意味着每个算法都可能在多个内核上运行。如果这样的算法实现在插入符号中可用???
最佳答案
我有 Linux 平台的最新版本,R 版本 3.2.2(2015-08-14,消防安全),并且并行化工作正常。您能否提供不能并行工作的代码。
> sessionInfo()
R version 3.2.2 (2015-08-14)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 14.04.3 LTS
locale:
[1] LC_CTYPE=en_CA.UTF-8 LC_NUMERIC=C LC_TIME=en_CA.UTF-8 LC_COLLATE=en_CA.UTF-8
[5] LC_MONETARY=en_CA.UTF-8 LC_MESSAGES=en_CA.UTF-8 LC_PAPER=en_CA.UTF-8 LC_NAME=C
[9] LC_ADDRESS=C LC_TELEPHONE=C LC_MEASUREMENT=en_CA.UTF-8 LC_IDENTIFICATION=C
attached base packages:
[1] parallel stats graphics grDevices utils datasets methods base
other attached packages:
[1] kernlab_0.9-22 doMC_1.3.3 iterators_1.0.7 foreach_1.4.2 caret_6.0-52 ggplot2_1.0.1 lattice_0.20-33
loaded via a namespace (and not attached):
[1] Rcpp_0.12.0 compiler_3.2.2 nloptr_1.0.4 plyr_1.8.3 tools_3.2.2 digest_0.6.8
[7] lme4_1.1-9 nlme_3.1-122 gtable_0.1.2 mgcv_1.8-7 Matrix_1.2-2 brglm_0.5-9
[13] SparseM_1.7 proto_0.3-10 BradleyTerry2_1.0-6 stringr_1.0.0 gtools_3.5.0 MatrixModels_0.4-1
[19] stats4_3.2.2 grid_3.2.2 nnet_7.3-10 minqa_1.2.4 reshape2_1.4.1 car_2.0-26
[25] magrittr_1.5 scales_0.3.0 codetools_0.2-11 MASS_7.3-43 splines_3.2.2 pbkrtest_0.4-2
[31] colorspace_1.2-6 quantreg_5.18 stringi_0.5-5 munsell_0.4.2
我已在本地计算机上将您的代码用于 BreastCancer
数据集,并且它可以并行运行,没有任何问题。我使用的是 RStudio 版本 0.98.1103。
library(caret)
library(mlbench)
data(BreastCancer)
library(doMC)
registerDoMC(cores=2)
classification_formula <- as.formula(paste("Class" ,"~",
paste(names(BreastCancer)[!names(BreastCancer)=='Class'],collapse="+")))
CVfolds <- 2
CVreps <- 5
ma_control <- trainControl(method = "repeatedcv",
number = CVfolds,
repeats = CVreps ,
returnResamp = "final" ,
classProbs = T,
summaryFunction = twoClassSummary,
allowParallel = TRUE,verboseIter = TRUE)
rf_tuneGrid = expand.grid(mtry = seq(2,32, length.out = 6))
#Notice, it might be easier just to use Class~.
#instead of classification_formula
rf <- train(classification_formula ,
data = BreastCancer ,
method = "rf",
metric="ROC" ,
trControl = ma_control,
tuneGrid = rf_tuneGrid ,
ntree = 101)
> rf
Random Forest
699 samples
10 predictors
2 classes: 'benign', 'malignant'
No pre-processing
Resampling: Cross-Validated (2 fold, repeated 5 times)
Summary of sample sizes: 341, 342, 342, 341, 342, 341, ...
Resampling results across tuning parameters:
mtry ROC Sens Spec ROC SD Sens SD Spec SD
2 0.9867820 1.0000000 0.0000000 0.005007691 0.000000000 0.000000000
8 0.9899107 0.9549550 0.9640196 0.002243649 0.006714919 0.017247716
14 0.9907072 0.9558559 0.9631933 0.003028258 0.012345228 0.008019979
20 0.9909514 0.9635135 0.9556513 0.003268291 0.006864342 0.010471005
26 0.9911480 0.9630631 0.9539706 0.003384987 0.005113930 0.010628533
32 0.9911485 0.9657658 0.9522969 0.002973508 0.004842197 0.004090206
ROC was used to select the optimal model using the largest value.
The final value used for the model was mtry = 32.
>
关于r-caret - 插入符不并行运行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32514370/
尝试使用 caret 包中的 preProcess 函数时出现以下错误。 predict 函数适用于 knn 和中值插补,但会给出装袋错误。我应该如何编辑对预测函数的调用。 可重现的例子: data
我正在尝试让两个 fontawesome 图标向上插入和向下插入以相互堆叠而不隐藏一个并显示另一个?任何建议将不胜感激。这是一个带有 Bootstrap 和 fontawesome 的 plucker
我目前正在使用列表来处理左侧菜单。一切正常,但现在我想对 font-awsome 执行操作,我正在尝试将 fa-caret-right 移动到 fa-caret-down。 fa-caret-righ
我试图了解 Caret 包中的 5 折交叉验证算法,但我无法找到如何为每一折获取训练集和测试集,而且我也无法从类似的建议问题中找到它。想象一下,如果我想通过随机森林方法进行交叉验证,我会执行以下操作:
在 R 包 caret 中,我们能否使用函数 createDataPartition()(或用于交叉验证的 createFolds())基于多个变量创建分层训练和测试集? 这是一个变量的示例: #2/
我对rfe库中的caret函数有疑问。在插入符号主页link上,他们给出了以下RFE算法: algorithm 对于此示例,我将rfe函数与3折交叉验证结合使用,并将train函数与linear-SV
我们可以通过利用foreach软件包,nnet和插入符号软件包来使用多核并行地训练神经网络模型吗? 我只看到randomforest并行执行。神经网络是否可能。 我对插入符号的火车功能特别感兴趣,该功
我希望使用带有不是默认选项之一的指标的插入符号包。对于下面的示例,我使用了 Metrics 包。我已经阅读了 StackOverflow 上的所有相关问题以及 caret 网站上的指南,但仍然收到错误
实际的并行插入符取决于 R、插入符和 doMC 软件包。如 Parallelizing Caret code 中所述 有人和我在类似的环境中工作吗? R 插入符并行化正常工作的最大 R 版本是什么?
我不知道如何使用R中的caret包提取训练误差(即在训练集上获得的误差)。例如,我有以下模型: data(iris); library(caret); model<-train(Species~.,
我最近在插入符号的 trainControl() Funktion 中发现了随机搜索选项。插入符如何生成参数以及是否有办法提供某种特定于用户的输入(例如从中采样参数的分布)?关于website我只找到
我的训练数据集 (train) 是一个具有 n 个特征 的数据框架,以及一个具有结果 y 的附加列。我建立了3个单独的模型,例如: m1 用于测试数据),并且在最后一步中,DATA_TO_PREDI
我正在尝试通过方法 useDelimiter("&|=|~ |^");. 除了被忽略的 ^ 之外,所有定界符都可以正常工作:这是为什么? 我在扫描仪文档中看不出原因。 最佳答案 你需要转义^,像这样:
我目前正在学习如何在 R 中实现逻辑回归 我已经获取了一个数据集并将其分成训练集和测试集,并希望实现前向选择、后向选择和最佳子集选择 使用交叉验证来选择最佳功能。我正在使用 caret 对训练数据集实
“插入符号”一词起源于文本插入点的何处?我试图用谷歌搜索它,但这很难找到(即使我的历史计算机引用书在这里似乎也无济于事)。 我相当确定我记得一些使用文字插入符号(即:^)作为文本插入标记的古老的 Wa
我正在使用 caret R中的库用于模型生成。我想生成一个 earth (又名 MARS)模型,我想指定 degree此模型生成的参数。根据documentation (第 11 页) earth方法
我想使用 AUC 作为性能度量,但 RFE 仅支持 RMSE、RSquared、Accuracy、Kappa。如何使用自定义指标,例如 auc? 最佳答案 您必须指定一个自定义 summaryFunc
代码: library(nnet) library(caret) #K-folds resampling method for fitting model ctrl <- trainControl(m
我试图通过将“knnImpute”传递给 Caret 的 train() 方法的 preProcess 参数来估算值。基于以下示例,这些值似乎没有被估算,保留为 NA,然后被忽略。我究竟做错了什么?
我正在训练基于来自 Kaggle 的心脏病数据的决策树模型。 . 由于我也在使用 10 倍 CV 构建其他模型,因此我尝试使用带有 rpart 方法的 caret 包来构建树。然而,情节结果很奇怪,因
我是一名优秀的程序员,十分优秀!