gpt4 book ai didi

python - 使用 PCA 计算原始数据集和转换后的数据集之间丢失的数据

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:40:16 25 4
gpt4 key购买 nike

我在 Python 中使用 sklearn 进行主成分分析。

我的目的之一是生成一个 4 分量模型,另一个包含 8 个分量,然后使用 inverse_transform 将两者与原始数据进行比较。

代码是这样的:

pca4 = PCA(n_components=4)
pca4.fit(parkinsonData)
scores4=pca.transform(parkinsonData)
reconstruct4=pca.inverse_transform(scores4)

要计算原始数据和我所做的重建数据之间的差异:

differenceMatrix=parkinsonData-reconstruct4

现在我有了差异,但我想计算原始数据集丢失的数据。为此,我想计算原始数据集和重建数据集的每个元素之间以 2 为幂的差值的平均值。

在最后一条语句中,我计算了原始数据集和重构数据集的每个元素之间的差异,但现在我必须计算幂。我不知道该怎么做,因为当我使用时:

power=differenceMatrix**

我得到一个错误:这个矩阵不是正方形的。

为了解决这个问题,我使用

np.power(differenceMatrix,differenceMatrix)

它可以工作,但有些元素是 NAN。我理解是因为缺少正方形。

谁知道如何解决这个问题,并使用 PCA 计算原始数据集和转换后的数据集之间丢失的数据?

谢谢。

最佳答案

要对矩阵的每个元素进行平方(我猜这就是你所说的“乘以 2”的意思),请使用:

np.square(differenceMatrix)

这适用于元素方面,不会限制您使用方形矩阵。矩阵中的 NaN 在输出中返回为 NaN。

关于python - 使用 PCA 计算原始数据集和转换后的数据集之间丢失的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43593238/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com