- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试了解如何正确使用 scikit-learn 的 SGDRegressor 模型。为了适应数据集,我需要调用一个function fit(X,y)
,其中x 是一个形状为 (n_samples,n_features) 的 numpy 数组,y 是长度为 n_samples 的一维 numpy 数组。我想弄清楚 y 应该代表什么。
例如我的数据显示如下:
我的特征是从 1972 年开始的年份,值是那一年的对应值。我试图预测 future 几年的值,例如 2008 年或 2012 年。我假设数据中的每一行都应该代表 X 中的一行/样本,其中每个元素都是一年的值。在那种情况下,你会是什么?我在想 y 应该只是年份,但是 y 的长度将是 n_features 而不是 n_samples。如果 y 的长度为 n_samples 那么 y 的长度可能是 5(下面显示的数据中的样本数)。我在想我必须以某种方式转换这些数据。
最佳答案
在机器学习中,y
代表数据的标签或目标。即,您的训练数据 (X
) 的正确答案。
如果你想学习一些与年份对应的值,那么这些年份将是你的训练数据(X
),与它们相关的正确值将是你的目标(y
).
您会注意到这符合您在第一段中提到的尺寸:X
的形状为 (n_samples, n_features)
因为它的条目数与你有几年,每个条目的大小为 1(你只有 1 个特征,年份)并且 y
的长度为 n_samples
因为你有一个与关联的值每年。
关于python - 如何在 scikit-learn 中使用 SGDRegressor,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30387365/
我是一名优秀的程序员,十分优秀!