gpt4 book ai didi

RRF 模型给出的测试集 NA

转载 作者:行者123 更新时间:2023-11-30 09:17:36 25 4
gpt4 key购买 nike

我正在研究回归问题。我在 R 中使用 RRF 来解决这个问题。我制作了两个不同的数据集,一个用于训练,另一个用于测试。

    library(RRF)
train=read.csv('training_data.csv'.header=F)
model <- RRF(as.numeric(V128) ~ .,data=train, flagReg = 1,importance=TRUE,ntree=1000, keep.forest=TRUE,type=regression,na.action=na.roughfix)
print(model)
Call:
RRF(formula = as.numeric(V128) ~ ., data = train, flagReg = 1, importance = TRUE, ntree = 1000, keep.forest = TRUE, type = regression, na.action = na.roughfix)
Type of random forest: regression
Number of trees: 1000
No. of variables tried at each split: 2656

Mean of squared residuals: 0.03509357
% Var explained: 81.5

现在,当我使用这个模型来预测测试集时。

    test = read.csv('testing_data.csv',header=F)
predict(model,test,type="response")

所有测试数据集都给出 NA。当我尝试训练数据集时,它仍然给我相同的结果。这是我完全没想到的。

当我运行时

    predict(model,new_data=test,type="response") 

    predict(model,new_data=train,type="response") 

返回object中的袋外预测。这意味着未给出数据。我应该怎么做才能得到预测?之后我还想找到预测的准确性或性能。

最佳答案

我现在也遇到同样的问题。 This answer已经帮助我确定了 NA 预测概率的原因。简短的答案:你的特征(或预测变量)中存在 NA。

我还在寻找建模过程其余部分的解决方案。当我有足够的信息来解决您的其余问题时,我会回来更新此答案。

伦巴...

关于RRF 模型给出的测试集 NA,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51148230/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com