gpt4 book ai didi

python - 使用 scikit python 进行自变量线性回归

转载 作者:太空宇宙 更新时间:2023-11-03 17:32:41 25 4
gpt4 key购买 nike

我是 Scikit-Learn 的新手,我需要解决使用 Python 预测新数据的问题。
我有一个二维数据表,如下所示:(抱歉,我无法在此处创建二维表)
-------------------------------------------------- ---
日期-----|小时
-------------------------------------------------- ---
------------| 1 | 2 | 3 | 4 |.....| 23 |
01 - 一月 | 3 | 7 | 22 | 22 46 | 46 .... | 94 | 94
...
9 月 23 日 | x| x| x| x |...
我的表有一个维度是日期,另一个维度是小时。每天都有 24 小时。每个小时都会得到一个随机的2位数字,该数字与其他数字无关。现在我可以使用线性回归预测接下来几天的新数据吗?请帮我!谢谢。

最佳答案

首先,如果我正确理解你的问题,那么对于约会的每个小时,你都会得到一个随机的 2 位数字。您有一组带有相应随机 2 位数的日期,现在对于没有随机 2 位数的新日期,您需要线性回归来预测该 2 位数是什么。

但是,我不知道这是否是最好的解决方案。对于线性回归,您需要一个预测变量(日期/小时)并使用它来预测参数/值(2 位数字)。不过您提到,该值是随机的,这意味着没有关系。除非有一个你没有提到的,否则我认为你无法预测这个两位数会是什么。最好的情况下,您只能通过生成新的随机 2 位数字来预测新的 2 位数字。

如果你还想做Linear Regression with Scikit-Learn ,您需要将数据拆分为训练集和测试集,以及 X 和 y。您的训练集是您知道的日期和时间(y)以及数字(x),您的测试集是日期和时间(y)。请注意,您希望将日期和时间合并为 1 条记录,因此您得到的实例如下:2001 年 9 月 23 日、2002 年 9 月 23 日、..、23 年 9 月 23 日。 (你的24小时在哪里?)我还建议在将数据加载到 python 之前对其进行拆分,或者使用 numpy matrices 进行拆分。 。您可以使用预测函数通过线性回归来预测 2 位数字。

希望这有帮助,如果格式困惑,请原谅(这里是新的)

关于python - 使用 scikit python 进行自变量线性回归,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31666524/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com