r - R中运行randomForest期间详细模式的说明-6ren

r - R中运行randomForest期间详细模式的说明

转载作者：行者123 更新时间：2023-12-04 13:32:01

24

4

我在R中使用详细模式(do.trace)运行randomForest，
我想知道消息中各列的含义是什么。
我可以看到ntree是树的数量，而OOB是袋装样本的百分比，但是“1”和“2”是什么？

> rf.m <- randomForest(x = X.train, y=as.factor(y.train), do.trace=10)
ntree      OOB      1      2
   10:  32.03% 15.60% 82.47%
   20:  29.18% 10.51% 86.31%
   30:  27.44%  7.47% 88.57%
   40:  26.48%  5.29% 91.33%
   50:  25.92%  4.35% 91.96%
   ....

最佳答案

输出中的1和2列给出了每个类的分类错误。 OOB值是类别错误的加权平均值(由每个类别中观察值的分数加权)。

一个示例(从帮助页面改编随机森林示例):

# Keep every 100th tree in the trace
set.seed(71)
iris.rf <- randomForest(Species ~ ., data=iris, importance=TRUE,
                        proximity=TRUE, do.trace=100)

ntree      OOB      1      2      3
  100:   6.00%  0.00%  8.00% 10.00%
  200:   5.33%  0.00%  6.00% 10.00%
  300:   6.00%  0.00%  8.00% 10.00%
  400:   4.67%  0.00%  8.00%  6.00%
  500:   5.33%  0.00%  8.00%  8.00%

与第100条树中的类错误的加权平均值得出的OOB错误率是6.0％。 ( prop.table返回物种的每个类别(每个类别)中观测值的分数)。我们将按元素乘以第100个树的类错误(如上面的跟踪值所给)，然后求和以得出所有类的加权平均错误(OOB错误)。

sum(prop.table(table(iris$Species)) * c(0, 0.08, 0.10))
[,1]
[1,] 0.06

如果您使用矩阵乘法，则可以避免使用sum，这在这里相当于点/标量/内积:

prop.table(table(iris$Species)) %*% c(0, 0.08, 0.10)

关于r - R中运行randomForest期间详细模式的说明，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28127429/

24

4

0

文章推荐： r - 使用 dplyr 截断数字变量的顶部和底部百分位数

文章推荐： ide - 不接受Webstorm生成器功能

文章推荐： variables - 将批处理变量保存在文本文件中

r - 为什么 R 中的 h2o.randomForest 比 randomForest 包做出更好的预测
setwd("D:/Santander") ## import train dataset train0.9999] train2<-train[,! colnames(train) %in% c(e
r - RandomForest 包中的预测函数使用 xtest 和 ytest 选项给出与 randomForest 不同的结果
当我运行这样的代码时，我对获得的不同结果感到困惑: set.seed(100) test1<-randomForest(BinaryY~., data=Xvars, trees=51, mtry=5,
r - randomForest() 如何预测不在训练数据中的新因子水平？
当我通过拆分单个数据帧创建训练集和测试集并使用 randomForest 包构建随机森林时，对于训练数据中不存在的某些因子级别， predict() 函数仍然会抛出一个输出。虽然这没有给出错误(这是我
当训练集具有比测试集更多不同的因子水平时，randomForest 不起作用
当尝试在因子水平低于我的训练数据的新测试数据上测试我的训练模型时，predict()返回以下内容: Type of predictors in new data do not match that o
用于分类的 R randomForest
我正在尝试使用 randomForest 进行分类，但我反复收到一条错误消息，似乎没有明显的解决方案(randomForest 在过去对我进行回归时效果很好)。我在下面粘贴了我的代码。 “成功”是一个
python - RandomForest，如何选择最优的n_estimator参数
我想训练我的模型并选择最佳的树数量。代码在这里 from sklearn.ensemble import RandomForestClassifier tree_dep = [3,5,6] tree_
R randomForest 投票平局
有谁知道 R randomForest 包用来解决分类关系的机制是什么 - 即当树最终在两个或多个类别中获得相同的投票时？文档说领带是随机断开的。但是，当您在一组数据上训练模型，然后使用一组验证数据
Python RandomForest - 未知标签错误
我在使用 RandomForest 拟合函数时遇到问题这是我的训练集 P1 Tp1 IrrPOA Gz Drz2 0
r - R randomForest 对数字类和整数类的变量的行为是否相同？
在 randomForest 包中实现的 R 随机森林算法对数字类和整数类的变量的行为是否相同？最佳答案是的，randomForest 实现确实对待整数和数字( double )类似。在 RF 模
r - 如何自定义包 "randomForest"生成的重要性图
重要性图: 我想将 y 轴文本向右对齐，并且还想根据不同的变量组为变量着色。例如 Limonene 和 Valencane，a-Selinene 和 g-Selinen 分别属于同一组。但我在 "r
R:如何在 randomForest 中使用长向量？
R 3.0.0 的新特性之一是引入了长向量。但是， .C() 和 .Fortran() 不接受长向量输入。在 R-bloggers我发现: This is a precaution as it is
r - 如何使 randomForest 模型尺寸变小？
我一直在用 R 对 700 万行数据(41 个特征)训练 randomForest 模型。这是一个示例调用: myModel <- randomForest(RESPONSE~., data=myda
R 包 'randomForest' 未安装
我一直在尝试安装 R 包“randomForest”，为此我运行了通常的安装命令 install.packages("randomForest", dependencies = T) 这给了我以下错误
具有warm_start结果的Scikit-learn Randomforest(不可广播的输出...)
我正在尝试构建一个在线随机森林分类器。在 for 循环中，我遇到了一个错误，但找不到原因。 clf = RandomForestClassifier(n_estimators=1, warm_star
r - 运行 randomForest 的因子变量和字符变量之间的差异
如果我运行 randomForest(y ~ x, data = df) 模型，x 会得到超过 53 个级别的因子变量 Error in randomForest.default(m, y, ...)
r - 分层抽样似乎不会改变 randomForest 结果
我在 R 中使用 randomForest 包来构建几个物种分布模型。我的响应变量是二元的(0 - 缺席或 1 存在)，并且非常不平衡 - 对于某些物种，缺席:存在的比率是 37:1。这种不平衡(或零
tree - WEKA - RandomForest 如何知道树何时太深？
我刚刚开始使用 Weka，当我的决策树太深时我无法理解。我有一组 423 个特征，据我所知，这些特征是为每个目标随机选择的。因此，这些特征子集生成带有决策叶的分支或流程，这些决策叶似乎不通用，实际上它
machine-learning - randomForest 中的树相互依赖吗？
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 5 年前。 Improve this ques
r - R 中的上采样 - randomForest
我的数据高度不平衡，想要对少数类进行上采样以提高准确性(少数类是感兴趣的对象)。我尝试在“randomForest”函数中使用“sampsize”选项 - 但它只允许下采样。我在某个地方读到，可以使
r - randomForest R 包的奇怪结果
我有一个包含 10,000 行和两列的数据框、段(具有 32 个值的因子)和目标(具有两个值"is"和“否”的因子，每个值 5,000 个)。我正在尝试使用随机森林来使用分段作为特征对目标进行分类。

首页

博学

6Ren·AI

商城

r - R中运行randomForest期间详细模式的说明