gpt4 book ai didi

python - 将随机森林预测作为列添加到测试文件中

转载 作者:太空宇宙 更新时间:2023-11-03 15:01:47 24 4
gpt4 key购买 nike

我在 python pandas(在 Jupyter 笔记本中)工作,我在其中为泰坦尼克号数据集创建了一个随机森林模型。 https://www.kaggle.com/c/titanic/data

我读取测试和训练数据,然后清理它并添加新列(两者的列相同)。

在拟合和重新拟合模型并尝试提升等之后;我决定选择一种模式:

 X2 = train_data[['Pclass','Sex','Age','richness']] 
rfc_model_3 = RandomForestClassifier(n_estimators=200)
%time cross_val_score(rfc_model_3, X2, Y_target).mean()
rfc_model_3.fit(X2, Y_target)

然后我预测,有没有人活下来

 X_test = test_data[['Pclass','Sex','Age','richness']]
predictions = rfc_model_3.predict(X_test)
preds = pd.DataFrame(predictions, columns=['Survived'])

有没有办法将预测作为添加到测试文件中?

最佳答案

rfc_model_3 = RandomForestClassifier(n_estimators=200)
rfc_model_3.predict(X_test)

返回 y : array of shape = [n_samples] ( see docs ),您应该能够将模型输出直接添加到 X_test 而无需创建中间 数据框:

X_test['survived'] = rfc_model_3.predict(X_test)

如果您仍然想要中间结果,@EdChum 在评论中的建议会很好。

关于python - 将随机森林预测作为列添加到测试文件中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37084800/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com