gpt4 book ai didi

python - 如何在 scikit-learn 中使用 SGDRegressor

转载 作者:太空宇宙 更新时间:2023-11-03 15:08:04 26 4
gpt4 key购买 nike

我正在尝试了解如何正确使用 scikit-learn 的 SGDRegressor 模型。为了适应数据集,我需要调用一个function fit(X,y),其中x 是一个形状为 (n_samples,n_features) 的 numpy 数组,y 是长度为 n_samples 的一维 numpy 数组。我想弄清楚 y 应该代表什么。

例如我的数据显示如下:

enter image description here

我的特征是从 1972 年开始的年份,值是那一年的对应值。我试图预测 future 几年的值,例如 2008 年或 2012 年。我假设数据中的每一行都应该代表 X 中的一行/样本,其中每个元素都是一年的值。在那种情况下,你会是什么?我在想 y 应该只是年份,但是 y 的长度将是 n_features 而不是 n_samples。如果 y 的长度为 n_samples 那么 y 的长度可能是 5(下面显示的数据中的样本数)。我在想我必须以某种方式转换这些数据。

最佳答案

在机器学习中,y 代表数据的标签或目标。即,您的训练数据 (X) 的正确答案。

如果你想学习一些与年份对应的值,那么这些年份将是你的训练数据(X),与它们相关的正确值将是你的目标(y).

您会注意到这符合您在第一段中提到的尺寸:X 的形状为 (n_samples, n_features) 因为它的条目数与你有几年,每个条目的大小为 1(你只有 1 个特征,年份)并且 y 的长度为 n_samples 因为你有一个与关联的值每年。

关于python - 如何在 scikit-learn 中使用 SGDRegressor,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30387365/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com