gpt4 book ai didi

r - randomForests 包中的 `LocalImp` 参数到底有什么作用?

转载 作者:行者123 更新时间:2023-12-02 02:36:14 26 4
gpt4 key购买 nike

谁能用相对简单的英语解释一下 randomForest 包中的参数 localImp 的作用?

randomForest 文档将此参数描述为:

should casewise importance measure be computed? (Setting this to TRUE will override importance.)

它还声明它生产:

a p by n matrix containing the casewise importance measures, the [i,j] element of which is the importance of i-th variable on the j-th case. NULL if localImp=FALSE

有人可以准确解释这意味着什么,或者向我指出他们详细讨论此参数的论文的方向。

谢谢

最佳答案

randomForest 包或多或少是 Leo Breiman 和 Adel Cutler 编写的 Fortran 代码的包装器。布雷曼是加州大学伯克利分校的统计学教授,他去世后他们保留了他的网站。

这是一个很棒的资源:
https://www.stat.berkeley.edu/~breiman/RandomForests/

在此网站中,他们在分类页面上提到了以下内容:

For each case, consider all the trees for which it is oob. Subtract the percentage of votes for the correct class in the variable-m-permuted oob data from the percentage of votes for the correct class in the untouched oob data. This is the local importance score for variable m for this case.

因此,对于观察 i,取所有未在 i 上训练的树,因为它没有在 Bootstrap 中选择。现在,考虑变量 m。排列不包含 i 的每棵树的遗漏 (oob) 观察值的 m 值。计算这些树的平均袋外准确度。还可以计算这些树的袋外精度,而无需排列变量 m 的值。从未排列的 oob 准确度中减去排列后的 m 准确度的平均值即可得出 (i,m) 局部重要性度量。

关于r - randomForests 包中的 `LocalImp` 参数到底有什么作用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57443766/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com