gpt4 book ai didi

python - SKLearn 使用新数据进行预测

转载 作者:行者123 更新时间:2023-11-28 18:12:50 24 4
gpt4 key购买 nike

我已经尝试使用 SKLearn 进行线性回归。我有一些类似的数据:卡路里消耗 |重量。

150 | 150

300 | 190

350 | 200

基本上是编造的数字,但我已将数据集拟合到线性回归模型中。

我感到困惑的是,我将如何使用新数据进行预测,假设我有 10 个新的卡路里摄入量,我希望它可以预测体重?

regressor = LinearRegression()
regressor.fit(x_train, y_train)
y_pred = regressor.predict(x_test) ??

但是我要如何制作只有我的 10 个新数据 摄入的卡路里数,并使其成为我希望回归器预测的测试集

最佳答案

您是对的,您只需调用模型的 predict 方法并传入新的未见数据以进行预测。现在它还取决于您所说的 new data 是什么意思。您引用的数据是您不知道其结果的(即您不知道权重值),还是该数据用于测试模型的性能?

对于新数据(预测):

您的做法是正确的。您只需打印 y_pred 变量即可访问所有预测。

您知道各自的权重值并且想要评估模型:

确保您有两个独立的数据集:x_test(包含特征)和 y_test(包含标签)。像使用 y_pred 变量一样生成预测,然后您可以使用许多性能指标计算其性能。最常见的是均方根,您只需将 y_testy_pred 作为参数传递即可。这是所有 regression performance metrics 的列表由 sklearn 提供。

如果不知道这10个新数据点的权重值:

使用train_test_split将您的初始数据集分成两部分:trainingtesting。您将拥有 4 个数据集:x_trainy_trainx_testy_test

from sklearn.model_selection import train_test_split
# random state can be any number (to ensure same split), and test_size indicates a 25% cut
x_train, y_train, x_test, y_test = train_test_split(calories_eaten, weight, test_size = 0.25, random_state = 42)

通过拟合 x_trainy_train 训练模型。然后通过对 x_test 进行预测并将这些预测y_test 的实际结果进行比较来评估模型的训练性能。这样您就可以了解模型的性能。此外,您还可以相应地预测 10 新数据点的权重值

作为初学者也值得进一步阅读该主题。 This是一个简单的教程。

关于python - SKLearn 使用新数据进行预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50181272/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com