gpt4 book ai didi

r - 如何使 randomForest 模型尺寸变小?

转载 作者:行者123 更新时间:2023-12-03 18:27:47 26 4
gpt4 key购买 nike

我一直在用 R 对 700 万行数据(41 个特征)训练 randomForest 模型。这是一个示例调用:

myModel <- randomForest(RESPONSE~., data=mydata, ntree=50, maxnodes=30)

我肯定认为只有 50 棵树和 30 个终端节点,“myModel”的内存占用会很小。但它在转储文件中是 65 兆。该对象似乎持有来自训练过程的各种预测、实际和投票数据。

如果我只想要森林,仅此而已呢?我想要一个小的转储文件,我可以稍后加载它以快速进行预测。我觉得森林本身不应该那么大......

任何人都知道如何将这个傻瓜简化为我可以预测 future 的东西?

最佳答案

试图摆脱将答案作为评论发布的习惯......
?randomForest建议不要使用包含大量变量的公式界面……如果不使用公式界面,结果会有什么不同吗? ?randomForest 的值部分还告诉您如何关闭某些输出(重要性矩阵、整个森林、邻近矩阵等)。

例如:

myModel <- randomForest(mydata[,!grepl("RESPONSE",names(mydata))],
mydata$RESPONSE, ntree=50, maxnodes=30, importance=FALSE,
localImp=FALSE, keep.forest=FALSE, proximity=FALSE, keep.inbag=FALSE)

关于r - 如何使 randomForest 模型尺寸变小?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13691029/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com