gpt4 book ai didi

随机森林重要性 - 图和数据框中的 %IncMSE 不同

转载 作者:行者123 更新时间:2023-12-04 14:34:52 30 4
gpt4 key购买 nike

我需要一些帮助来了解 R 可用的随机森林包中内置的重要功能。

运行随机森林 (rf) 后,可以使用 rf$importance 访问重要性。然后返回的数据帧包含两个字段:%IncMSE 和 IncNodePurity。

它们都可以使用随机森林包中内置的 varImpPlot() 函数绘制。但是,绘制的 %IncMSE 值与使用前面提到的方法 (rf$importance) 访问的结果不对应。

让我用一个例子来解释这个问题:

data(mtcars)
rf<-randomForest(mpg~ .,data=mtcars,importance=T,mtry=3)
rf$importance
varImpPlot(rf)

%IncMSE 的最大值为 9.91 (disp),但图中的最大值约为 14。图中的所有其他值和使用 rf$importance 访问的值也不同。 (注意 IncNodePurity 没有区别)

谁能解释一下?哪些值(value)观是正确的?

最佳答案

正如我在评论中指出的那样,它们不相同的原因是 varImpPlot 使用随机森林对象的 importanceSD 组件绘制缩放值。这可以使用 varImpPlotscale 参数来控制。

关于随机森林重要性 - 图和数据框中的 %IncMSE 不同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24173781/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com