gpt4 book ai didi

python - Sklearn : Alternative Dim Reduction? 中的 PCA 内存错误

转载 作者:太空狗 更新时间:2023-10-29 21:45:20 25 4
gpt4 key购买 nike

我试图在 Sklearn 中使用 PCA 来减少一个非常大的矩阵的维数,但它会产生内存错误(所需的 RAM 超过 128GB)。我已经设置了 copy=False 并且我正在使用计算成本较低的随机 PCA。

有解决办法吗?如果不是,我可以使用哪些其他需要更少内存的暗淡减少技术。谢谢。


更新:我尝试 PCA 的矩阵是一组特征向量。它来自通过预训练的 CNN 传递一组训练图像。矩阵是 [300000, 51200]。尝试的 PCA 组件:100 到 500。

我想降低它的维度,以便我可以使用这些功能来训练 ML 算法,例如 XGBoost。谢谢。

最佳答案

最后,我使用了 TruncatedSVD 而不是 PCA,它能够处理大型矩阵而不会出现内存问题:

from sklearn import decomposition

n_comp = 250
svd = decomposition.TruncatedSVD(n_components=n_comp, algorithm='arpack')
svd.fit(train_features)
print(svd.explained_variance_ratio_.sum())

train_features = svd.transform(train_features)
test_features = svd.transform(test_features)

关于python - Sklearn : Alternative Dim Reduction? 中的 PCA 内存错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43357507/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com