gpt4 book ai didi

python - 我可以标准化我的 PCA 应用计数向量吗?

转载 作者:太空宇宙 更新时间:2023-11-04 04:18:10 25 4
gpt4 key购买 nike

我在我的 X_train 上应用了 CountVectorizer(),它返回了一个稀疏矩阵。

通常,如果我们想要标准化稀疏矩阵,我们会传入 with_mean=False 参数。

scaler = StandardScaler(with_mean=False)
X_train = scaler.fit_transform()

但在我的例子中,在对我的 X_train 应用 CountVectorizer 之后,我还执行了 PCA(TruncatedSVD) 来减小维度。现在我的数据不是稀疏矩阵。

那么现在我可以直接应用 StandardScaler() 而无需传递 with_mean=False (即 with_mean=True) 吗?

最佳答案

如果你拿 lookwith_mean 参数的作用下,您会发现它只是在缩放之前将数据居中。不将稀疏矩阵居中的原因是,当您尝试将稀疏矩阵居中时,它会变成稠密矩阵并占用更多内存,从而首先破坏其稀疏性。

在执行 PCA 后,您的数据已减少维度,现在可以在缩放之前居中。所以是的,您可以直接应用 StandardScaler()

关于python - 我可以标准化我的 PCA 应用计数向量吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55047627/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com