gpt4 book ai didi

random-forest - h2o随机森林中 "importance"的度量是什么

转载 作者:行者123 更新时间:2023-12-04 04:16:13 24 4
gpt4 key购买 nike

这是我的代码:

set.seed(1)

#Boruta on the HouseVotes84 data from mlbench
library(mlbench) #has HouseVotes84 data
library(h2o) #has rf

#spin up h2o
myh20 <- h2o.init(nthreads = -1)

#read in data, throw some away
data(HouseVotes84)
hvo <- na.omit(HouseVotes84)

#move from R to h2o
mydata <- as.h2o(x=hvo,
destination_frame= "mydata")

#RF columns (input vs. output)
idxy <- 1
idxx <- 2:ncol(hvo)

#split data
splits <- h2o.splitFrame(mydata,
c(0.8,0.1))

train <- h2o.assign(splits[[1]], key="train")
valid <- h2o.assign(splits[[2]], key="valid")

# make random forest
my_imp.rf<- h2o.randomForest(y=idxy,x=idxx,
training_frame = train,
validation_frame = valid,
model_id = "my_imp.rf",
ntrees=200)

# find importance
my_varimp <- h2o.varimp(my_imp.rf)
my_varimp

我得到的输出是“可变重要性”。

经典的度量是“准确度平均降低”和“基尼系数平均降低”。

我的结果是:
> my_varimp
Variable Importances:
variable relative_importance scaled_importance percentage
1 V4 3255.193604 1.000000 0.410574
2 V5 1131.646484 0.347643 0.142733
3 V3 921.106567 0.282965 0.116178
4 V12 759.443176 0.233302 0.095788
5 V14 492.264954 0.151224 0.062089
6 V8 342.811554 0.105312 0.043238
7 V11 205.392654 0.063097 0.025906
8 V9 191.110046 0.058709 0.024105
9 V7 169.117676 0.051953 0.021331
10 V15 135.097076 0.041502 0.017040
11 V13 114.906586 0.035299 0.014493
12 V2 51.939777 0.015956 0.006551
13 V10 46.716656 0.014351 0.005892
14 V6 44.336708 0.013620 0.005592
15 V16 34.779987 0.010684 0.004387
16 V1 32.528778 0.009993 0.004103

因此,我对“投票#4”(也称为V4)的相对重视程度是〜3255.2。

问题:
这是什么单位?
那是如何得出的?

我尝试查看文档,但找不到答案。我尝试了帮助文档。我尝试使用Flow查看参数以查看其中是否有任何指示。他们都找不到“基尼”或“降低准确性”。我应该去哪里看?

最佳答案

答案在docs中。

[在左 Pane 中,单击“算法”,然后单击“受监管”,然后单击“DRF”。常见问题解答部分回答了这个问题。 ]

为了方便起见,还将答案复制并粘贴到此处:

“如何为DRF计算变量重要性?变量重要性是通过计算每个变量的相对影响来确定的:在树的构建过程中,是否在拆分过程中选择了该变量,并且平方误差(在所有树上)因此提高了多少。 ”

关于random-forest - h2o随机森林中 "importance"的度量是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36021137/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com