gpt4 book ai didi

r - h2o.gbm 中的树木数量

转载 作者:行者123 更新时间:2023-11-30 09:50:26 29 4
gpt4 key购买 nike

在传统的GBM中,我们可以使用 Predict.gbm(模型, newsdata=..., n.tree=...)

这样我就可以将测试数据的结果与不同数量的树进行比较。

在h2o.gbm中,虽然有n.tree要设置,但似乎对结果没有任何影响。与默认模型完全相同:

h2o.test.pred <- as.vector(h2o.predict(h2o.gbm.model, newdata=test.frame, n.tree=100))
R2(h2o.test.pred, test.mat$y)
[1] -0.00714109
h2o.test.pred <- as.vector(h2o.predict(h2o.gbm.model, newdata=test.frame, n.tree=10))
> R2(h2o.test.pred, test.mat$y)
[1] -0.00714109

有人有类似的问题吗?怎么解决呢? h2o.gbm 比 gbm 快得多,所以如果它能得到每棵树的详细结果那就太好了。

最佳答案

我认为 H2O 不支持您所描述的内容。

但是,如果您想要获得针对所使用的树数量的性能,则可以在模型构建时完成。

library(h2o)
h2o.init()

iris <- as.h2o(iris)
parts <- h2o.splitFrame(iris,c(0.8,0.1))
train <- parts[[1]]
valid <- parts[[2]]
test <- parts[[3]]
m <- h2o.gbm(1:4, 5, train,
validation_frame = valid,
ntrees = 100, #Max desired
score_tree_interval = 1)

h2o.scoreHistory(m)
plot(m)

分数历史记录将显示添加每棵新树后的评估。 plot(m) 将显示一个图表。看起来 20 对于鸢尾花来说已经足够了!

顺便说一句,如果您的真正目的是找出要使用的最佳树木数量,那么请打开提前停止功能,它会自动为您执行此操作。 (只需确保您同时使用验证数据框和测试数据框即可。)

关于r - h2o.gbm 中的树木数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45953884/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com