gpt4 book ai didi

来自RandomForest的R意外NA输出

转载 作者:行者123 更新时间:2023-12-02 05:45:12 26 4
gpt4 key购买 nike

我正在处理一个包含大量 NA 的数据集。我知道前 6 列没有任何 NA。由于第一列是 ID 列,因此我将其省略。

我运行以下代码以仅选择在响应列中具有值的行:

sub1 <- TrainingData[which(!is.na(TrainingData[,70])),]

然后我使用以下代码将 sub1 用作随机森林中的数据集:

set.seed(448)
RF <- randomForest(sub1[,c(2:6)], sub1[,70]
,do.trace=TRUE,importance=TRUE,ntree=10,,forest=TRUE)

然后我运行这段代码来检查 NA 的输出:

> length(which(is.na(RF$predicted)))
[1] 65

如果输入的数据是干净的,我不明白为什么我会得到 NA。

有什么建议吗?

最佳答案

我认为你应该使用更多的树。因为 predicted 值是袋外集的预测值。如果树的数量非常少,一些情况永远不会出现在袋外集合中,因为这个集合是随机形成的。

关于来自RandomForest的R意外NA输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10367579/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com