python - 如何在 scikit-learn 中使用 SGDRegressor-6ren

python - 如何在 scikit-learn 中使用 SGDRegressor

转载作者：太空宇宙更新时间：2023-11-03 15:08:04

我正在尝试了解如何正确使用 scikit-learn 的 SGDRegressor 模型。为了适应数据集，我需要调用一个function fit(X,y)，其中x 是一个形状为 (n_samples,n_features) 的 numpy 数组，y 是长度为 n_samples 的一维 numpy 数组。我想弄清楚 y 应该代表什么。

例如我的数据显示如下:

enter image description here

我的特征是从 1972 年开始的年份，值是那一年的对应值。我试图预测 future 几年的值，例如 2008 年或 2012 年。我假设数据中的每一行都应该代表 X 中的一行/样本，其中每个元素都是一年的值。在那种情况下，你会是什么？我在想 y 应该只是年份，但是 y 的长度将是 n_features 而不是 n_samples。如果 y 的长度为 n_samples 那么 y 的长度可能是 5(下面显示的数据中的样本数)。我在想我必须以某种方式转换这些数据。

最佳答案

在机器学习中，y 代表数据的标签或目标。即，您的训练数据 (X) 的正确答案。

如果你想学习一些与年份对应的值，那么这些年份将是你的训练数据(X)，与它们相关的正确值将是你的目标(y).

您会注意到这符合您在第一段中提到的尺寸:X 的形状为 (n_samples, n_features) 因为它的条目数与你有几年，每个条目的大小为 1(你只有 1 个特征，年份)并且 y 的长度为 n_samples 因为你有一个与关联的值每年。

关于python - 如何在 scikit-learn 中使用 SGDRegressor，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30387365/