gpt4 book ai didi

python - 使用基于训练数据集的模型预测测试数据?

转载 作者:太空宇宙 更新时间:2023-11-04 02:43:58 25 4
gpt4 key购买 nike

我是数据科学和分析的新手。在 Kaggle 上研究了很多内核之后,我制作了一个预测特性价格的模型。我使用我的训练数据测试了这个模型,但现在我想在我的测试数据上运行它。我有一个 test.csv 文件,我想使用它。我怎么做?我之前对我的训练数据集做了什么:

#loading my train dataset into python
train = pd.read_csv('/Users/sohaib/Downloads/test.csv')

#factors that will predict the price
train_pr = ['OverallQual','GrLivArea','GarageCars','TotalBsmtSF','FullBath','YearBuilt']

#set my model to DecisionTree
model = DecisionTreeRegressor()

#set prediction data to factors that will predict, and set target to SalePrice
prdata = train[train_pr]
target = train.SalePrice

#fitting model with prediction data and telling it my target
model.fit(prdata, target)

model.predict(prdata.head())

现在我尝试做的是,复制整个代码,并将“train”更改为“test”,将“predate”更改为“testprdata”,我认为它会起作用,但遗憾的是没有。我知道我做错了什么,我知道是什么。

最佳答案

只要您以完全相同的方式处理训练数据和测试数据,predict 函数就可以对任一数据集起作用。因此,您需要同时加载训练集和测试集,适合训练集,并预测仅测试集或训练集和测试集。

另外,请注意您正在阅读的文件是测试 数据。假设您的文件命名正确,即使您将变量命名为 train,您目前正在对您的测试数据进行训练。

#loading my train dataset into python
train = pd.read_csv('/Users/sohaib/Downloads/train.csv')
test = pd.read_csv('/Users/sohaib/Downloads/test.csv')

#factors that will predict the price
desired_factors = ['OverallQual','GrLivArea','GarageCars','TotalBsmtSF','FullBath','YearBuilt']

#set my model to DecisionTree
model = DecisionTreeRegressor()

#set prediction data to factors that will predict, and set target to SalePrice
train_data = train[desired_factors]
test_data = test[desired_factors]
target = train.SalePrice

#fitting model with prediction data and telling it my target
model.fit(train_data, target)

model.predict(test_data.head())

关于python - 使用基于训练数据集的模型预测测试数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45681387/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com