gpt4 book ai didi

machine-learning - 线性回归测试数据违反训练数据。请解释我哪里出错了

转载 作者:行者123 更新时间:2023-11-30 09:14:08 24 4
gpt4 key购买 nike

这是包含 1000 个不同地点房屋租金定价条目的数据集的一部分。

训练模型后,如果我发送与测试数据相同的训练数据,我会得到不正确的结果。这怎么可能?

X_loc = df[{'area','rooms','location'}]

y_loc = df[:]['price']

X_train, X_test, y_train, y_test = train_test_split(X_loc, y_loc, test_size = 1/3, random_state = 0)

regressor = LinearRegression()

regressor.fit(X_train, y_train)

y_pred = regressor.predict(X_train[0:1])

数据集:

    price rooms  area location

0 0 22000 3 1339 140

1 1 45000 3 1580 72

3 3 72000 3 2310 72

4 4 40000 3 1800 41

5 5 35000 3 2100 57

预期输出 (y_pred) 应为 220000,但显示为 290000 它如何违反已训练的输入?

最佳答案

您观察到的正是所谓的“训练错误”。机器学习模型旨在找到“最佳”拟合,从而最大限度地减少“总误差”(即针对所有数据点而不是每个数据点)。22000 与 29000 相差并不远,尽管它不是确切的数字。这是因为线性回归尝试压缩数据中的所有变化以遵循一条直线。

关于machine-learning - 线性回归测试数据违反训练数据。请解释我哪里出错了,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59510627/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com