R Caret/如何在RFE中对火车进行交叉验证-6ren

R Caret/如何在RFE中对火车进行交叉验证

转载作者：行者123 更新时间：2023-12-04 04:38:50

26

4

我对rfe库中的caret函数有疑问。在插入符号主页link上，他们给出了以下RFE算法:
algorithm

对于此示例，我将rfe函数与3折交叉验证结合使用，并将train函数与linear-SVM和5折交叉验证结合使用。

library(kernlab)
library(caret)
data(iris)

# parameters for the tune function, used for fitting the svm
trControl <- trainControl(method = "cv", number = 5)

# parameters for the RFE function
rfeControl <- rfeControl(functions = caretFuncs, method = "cv",
                     number= 4, verbose = FALSE )

rf1 <- rfe(as.matrix(iris[,1:4]), as.factor(iris[,5]) ,sizes = c( 2,3) ,  
           rfeControl = rfeControl, trControl = trControl, method = "svmLinear")

从上面的算法中，我假设该算法可以使用2个嵌套的交叉验证:

rfe将数据(150个样本)分成3折

train函数将在训练集(100个样本)上运行，并进行5倍交叉验证以调整模型参数-并进行后续RFE。

让我感到困惑的是，当我查看 rfe函数的结果时:

> lapply(rf1$control$index, length)
$Fold1
[1] 100
$Fold2
[1] 101
$Fold3
[1] 99

> lapply(rf1$fit$control$index, length)
$Fold1
[1] 120
$Fold2
[1] 120
$Fold3
[1] 120
$Fold4
[1] 120
$Fold5
[1] 120

由此看来，当我期望80的大小时，来自5倍cv的训练集的大小为120个样本。

因此，如果有人可以澄清rfe和培训如何一起工作，那将是非常不错的。

干杯

> sessionInfo()
R version 2.15.1 (2012-06-22)
Platform: i386-apple-darwin9.8.0/i386 (32-bit)

locale:
[1] C

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
 [1] pROC_1.5.4      e1071_1.6-1     class_7.3-5     caret_5.15-048 
 [5] foreach_1.4.0   cluster_1.14.3  plyr_1.7.1      reshape2_1.2.1 
 [9] lattice_0.20-10 kernlab_0.9-15 

loaded via a namespace (and not attached):
 [1] codetools_0.2-8 compiler_2.15.1 grid_2.15.1     iterators_1.0.6
 [5] stringr_0.6.1   tools_2.15.1

最佳答案

这里的问题是lapply(rf1$fit$control$index, length)不存储我们认为的内容。

据我了解，有必要研究代码。发生了以下情况:

当您调用rfe时，整个数据将传递到nominalRfeWorkflow。

在nominalRfeWorkflow中，根据rfeControl(在我们的示例中，根据3折CV规则进行了3次拆分)的训练数据和测试数据将传递给rfeIter。
我们可以在rf1$control$index下的结果中找到这些拆分。

在rfeIter中，约100个训练样本(我们的示例)用于查找最终变量(该函数的输出)。
据我了解，〜50个测试样本(我们的示例)用于计算不同变量集的性能，但它们仅作为外部性能存储，而不用于选择最终变量。
为了选择这些，使用了5倍交叉验证的性能估计。
但是我们无法在rfe返回的最终结果中找到这些索引。
如果确实需要它们，则需要从fitObject$control$index中的rfeIter中获取它们，将它们返回到nominalRfeWorkflow，然后再返回rfe，然后从那里返回到rfe返回的结果rfe -Class对象中。

那么lapply(rf1$fit$control$index, length)中存储了什么？ -当rfe找到最佳变量时，将使用最佳变量和完整引用数据创建最终模型拟合(150)。 rf1$fit是在rfe中创建的，如下所示:
fit <- rfeControl$functions$fit(x[, bestVar, drop = FALSE], y, first = FALSE, last = TRUE, ...)
该函数再次运行train函数，并使用完整的引用数据，最终功能集和通过省略号(trControl)给出的...进行最终交叉验证。
由于我们的trControl应该做5倍CV，因此lapply(rf1$fit$control$index, length)返回120是正确的，因为我们必须计算150/5 * 4 = 120。

关于R Caret/如何在RFE中对火车进行交叉验证，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14466979/

26

4

0

文章推荐： autocomplete - 是否可以让 Windows 自动完成自定义命令？

文章推荐： Spring @Transactional value param with SpEL(Spring 表达式语言)

文章推荐： jqGrid 日期列排序不适用于 sorttype :'date'

文章推荐： VBA 循环遍历连续编号的名称

gcc - 如何使用单个 GCC(交叉)编译器(交叉)编译为 ARM 硬浮点和软浮点 (softfp)？
我想使用单个(交叉)编译器来编译不同 ARM 调用约定的代码:因为我总是想使用浮点和 NEON 指令，所以我只想选择硬浮点调用约定或软浮点(softfp)调用约定。我的编译器默认为硬浮点，但它支持我
Java共享(交叉)依赖管理
假设我正在构建一个依赖于两个库的 java 应用程序:A 和 B。A 和 B 都依赖于库 C。管理 A 和 B 使用相同版本的最佳方法是什么所以他们不冲突？我正在使用 Gradle。最佳答案从 G
交叉(错误符号)图像下的android按钮文本
我想在按钮的文本上添加图像。如果我将图像添加为按钮的背景，它就会添加到文本下方。预期结果作为图像添加。请帮忙更新:我需要以编程方式执行此操作。最佳答案在 XML 中， * 在代码中
css - 如何制作汉堡菜单的动画 - 交叉
我已经开始使用 CSS3 制作动画了。我尝试创建一个动画汉堡菜单，但结果有点难看。顶部和底部的条向右平移一点。所以旋转动画不是很流畅和正确。这是结果 => 这是我的代码: /* HTML */
python - 如何使用opencv或python检测2条相交(交叉)的曲线？
给定一个具有2条相交曲线的图像，如下图所示，我如何使用opencv或python检测和区分2条曲线？ (所以我需要2条单独的曲线) 最佳答案您可以扫描每一列，并从连接的零件中识别出簇。伪算法: l
gcc - 交叉 mingw 编译因未知伪操作而失败
我正在尝试在 redhat 集群(x86_64 主机)上设置 cross-mingw。我没有 root 访问权限，并且可用的 mingw 二进制文件不起作用(坏 glibc 版本等)。我正在阅读本教程
java - JavaFX 中的图像碰撞/交叉
我正在尝试在javaFX中开发一个游戏，当两个图像相交时，分数将被更新，并且障碍物将不可见。但不幸的是，在游戏中分数不断更新。我想我无法在游戏中正确地使图像不可见。以下是相关类的完整代码: pac
css - 固定位置展开并从右侧主 div 交叉
pikastar dot com 是网站，当向下滚动它然后在导航菜单展开固定位置时它 > 将穿过主 div。我该如何修复它。 #topNav.sticky { box-shadow: 0 10
c++ - 交叉 g++ 编译器链接器错误
我正在使用 Eclipse为 ARM 处理器交叉编译 g++ 项目。我在 Windows 环境中使用 yagarto 工具链。我对 C 项目没有问题，但是对于 C++，我一直收到错误: libc.a(
ruby - 如何从两个哈希数组中获取联合/交叉/差异并忽略一些键
我想从两个哈希数组中获取并集/交集/差集，例如: array1 = [{:name =>'Guy1', :age => 45},{:name =>'Guy2', :age => 45}] array2
Grails - 交叉 Controller 代码，在每个请求上执行
有没有办法在调用任何 Controller 操作之前执行一些代码？我需要根据 get 参数的值设置 session 变量，而不考虑调用哪个 Controller 。当然，一旦这个处理完成，请求需要
python - 交叉 3D 网格 python
我刚开始使用 3D 网格，面向用于有限元分析。我想在立方体状矩阵中模拟 Material 的夹杂物(任何形状，但主要对球体和椭圆体感兴趣)。这些夹杂物不应彼此重合。所以我想为python使用某种包，
sharedpreferences - Xamarin Forms Sharedpreferences 交叉
我想知道以跨平台方式操作应用程序设置的最佳解决方案是什么。在 iOS 中，我们可以在设置屏幕中更改应用程序外部的设置，但在 windows phone 和 android 中我们没有。所以，我的想
javascript - knockout 交叉 View 模型
var barcodeNum = ko.observable(""); VelocityMeetings.scan = function (params) { var errorMessage = k
r - 将(交叉)表转换为 ListView
这个问题在这里已经有了答案: Transforming data.frame in R (2 个答案) 关闭10 年前。过去我问过一个关于如何create cross tables from a
javascript - Angularjs - 交叉 Controller 工厂更新
我有两个共享同一个工厂的 Controller 。其中一个 Controller 正在更新工厂变量。其他人应该注意该变化并稍后显示。我是这样尝试的: http://plnkr.co/edit/q1N
mysql - SQL - 交叉 'Crossed' 表
标题不好，但这是我发现的将我的问题与简单的表格交叉区分开来的方式，因为我之前的研究总是让我接触到这类主题。我有几个表 - 为了简化起见，我们只用 3 个表来命名它们:A、B、C。我想将它们全部放在一
mysql - SELECT JOIN 与条件 (OR) 交叉
我需要做这样的事情(在 MySQL 中)，我使用 UNION 的尝试直到现在才奏效。理论上: SELECT * FROM tableA A JOIN tableB B ON A.tableAId =
c++ - SDL 交叉 header 渲染
注意:使用SDL 2.0，Cross header class问题我在类之间进行交叉引用，主要是我的类初始化渲染器和我的纹理类引用渲染初始化。现在，我已经能够运行该程序，直到我开始放入纹理类，代码也
javascript - 检查数组中匹配字母的算法(之前，之后，交叉)
我有一个这样的字母数组 var letters = ["Y", "X", "A", "Y", "O", "H", "A", "O", "O"]; 我创建了一个循环来

首页

博学

6Ren·AI

商城

R Caret/如何在RFE中对火车进行交叉验证