gpt4 book ai didi

scikit-learn - 如何在 Scikit-learn 中使用稀疏矩阵制作多项式特征

转载 作者:行者123 更新时间:2023-12-04 03:02:15 27 4
gpt4 key购买 nike

我正在使用 Scikit-learn 将我的训练数据转换为多项式特征,然后将其拟合到线性模型中。

model = Pipeline([('poly', PolynomialFeatures(degree=3)),
('linear', LinearRegression(fit_intercept=False))])
model.fit(X, y)

但是会报错

TypeError: A sparse matrix was passed, but dense data is required

我知道我的数据是稀疏矩阵格式。因此,当我尝试将我的数据转换为密集矩阵时,它显示内存错误。因为我的数据很大(50k~)。由于这些大量数据,我无法将其转换为密集矩阵。

我还找到了 Github Issues请求此功能的地方。但仍未实现。

所以请有人告诉我如何在 Scikit-learn 的 PolynomialFeatures 中使用稀疏数据格式而不将其转换为密集格式?

最佳答案

这是即将发布的 sklearn 0.20 版本中的一项新功能。参见 Release History - V0.20 - Enhancements如果你真的想测试它,你可以按照 Sklean - Advanced Installation - Install Bleeding Edge 中的说明安装开发版本。 .

关于scikit-learn - 如何在 Scikit-learn 中使用稀疏矩阵制作多项式特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48199391/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com