作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 Scikit-learn 将我的训练数据转换为多项式特征,然后将其拟合到线性模型中。
model = Pipeline([('poly', PolynomialFeatures(degree=3)),
('linear', LinearRegression(fit_intercept=False))])
model.fit(X, y)
但是会报错
TypeError: A sparse matrix was passed, but dense data is required
我知道我的数据是稀疏矩阵
格式。因此,当我尝试将我的数据转换为密集矩阵
时,它显示内存错误
。因为我的数据很大(50k~)。由于这些大量数据,我无法将其转换为密集矩阵。
我还找到了 Github Issues请求此功能的地方。但仍未实现。
所以请有人告诉我如何在 Scikit-learn 的 PolynomialFeatures 中使用稀疏数据格式而不将其转换为密集格式?
最佳答案
这是即将发布的 sklearn 0.20 版本中的一项新功能。参见 Release History - V0.20 - Enhancements如果你真的想测试它,你可以按照 Sklean - Advanced Installation - Install Bleeding Edge 中的说明安装开发版本。 .
关于scikit-learn - 如何在 Scikit-learn 中使用稀疏矩阵制作多项式特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48199391/
我是一名优秀的程序员,十分优秀!