gpt4 book ai didi

python - 如何选择PCA scikitliear的组件数量

转载 作者:行者123 更新时间:2023-11-28 22:13:39 24 4
gpt4 key购买 nike

我正在尝试使用 PCA 分解我的列。

我发现了一些关于如何选择我的困难使用 scikit 在 python 中学习的函数 PCA 的 n_components。我这样做了

sc = StandardScaler()
Z = sc.fit_transform(X)
pca = PCA(n_components = 5')

你能解释一下吗?

最佳答案

没有答案可以以 1 的概率告诉您什么是正确的分量数。它是特定于应用程序的。

但是,您可以使用以下试探法。您绘制解释方差比并选择“捕获”至少 95% 的方差的多个组件。在以下示例中,捕获大约 95% 方差的组件数量约为 30。

pca = PCA().fit(digits.data)
plt.plot(np.cumsum(pca.explained_variance_ratio_))
plt.xlabel('number of components')
plt.ylabel('cumulative explained variance')

enter image description here

关于python - 如何选择PCA scikitliear的组件数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53802098/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com