python - 二维 PCA 线拟合与 numpy-6ren

python - 二维 PCA 线拟合与 numpy

转载作者：太空狗更新时间：2023-10-30 02:42:04

33

4

我正在尝试使用 numpy 实现 2D PCA。代码相当简单:

import numpy as np

n=10
d=10
x=np.linspace(0,10,n)
y=x*d

covmat = np.cov([x,y])
print(covmat)

eig_values, eig_vecs = np.linalg.eig(covmat)
largest_index = np.argmax(eig_values)
largest_eig_vec = eig_vecs[largest_index]

协方差矩阵为:

[[   11.31687243   113.16872428]
 [  113.16872428  1131.6872428 ]]

然后我得到了一个简单的辅助方法，可以在给定中心周围沿给定方向绘制一条线(作为一系列点)。这意味着由 pyplot 使用，因此我正在为 x 和 y 坐标准备单独的列表。

def plot_line(center, dir, num_steps, step_size):
    line_x = []
    line_y = []
    for i in range(num_steps):
        dist_from_center = step_size * (i - num_steps / 2)
        point_on_line = center + dist_from_center * dir
        line_x.append(point_on_line[0])
        line_y.append(point_on_line[1])
    return (line_x, line_y)

最后是情节设置:

lines = []
mean_point=np.array([np.mean(x),np.mean(y)])
lines.append(plot_line(mean_point, largest_eig_vec, 200, 0.5))

import matplotlib.pyplot as plt

fig = plt.figure()
ax = fig.add_subplot(111)

ax.scatter(x,y, c="b", marker=".", s=10
           )
for line in lines:
    ax.plot(line[0], line[1], c="r")

ax.scatter(mean_point[0], mean_point[1], c="y", marker="o", s=20)

plt.axes().set_aspect('equal', 'datalim')
plt.show()

不幸的是，PCA 似乎不起作用。这是情节:

恐怕我不知道出了什么问题。

我手动计算了协方差 -> 相同的结果。
我检查了另一个特征值 -> 垂直于红线。
我已经用方向 (1,10) 测试了 plot_line。它完全符合我的观点:

最后的图显示 pca 拟合的线是正确的结果，只是它在 y 轴上镜像。

事实上，如果我改变特征向量的 x 坐标，直线就完美拟合了:

显然这是一个基本问题。不知何故，我误解了如何使用 pca。

我的错误在哪里？在线资源似乎完全按照我实现的方式描述了 PCA。我不相信我必须在 y 轴上明确地反射(reflect)我的线拟合。它必须是别的东西。

最佳答案

您的错误是您正在提取特征向量数组的最后行。但是特征向量构成了 np.linalg.eig 返回的特征向量数组的列，而不是行。来自documentation :

[...] the arrays a, w, and v satisfy the equations dot(a[:,:], v[:,i]) = w[i] * v[:,i] [for each i]

其中 a 是应用了 np.linalg.eig 的数组，w 是一维特征值数组，v 是特征向量的二维数组。所以 v[:, i] 列是特征向量。

在这种简单的二维情况下，由于两个特征向量相互正交(因为我们从对称矩阵开始)和单位长度(因为 np.linalg.eig 以这种方式对它们进行归一化), 特征向量数组具有以下两种形式之一

[[ cos(t)  sin(t)]
 [-sin(t)  cos(t)]]

或

[[ cos(t)  sin(t)]
 [ sin(t) -cos(t)]]

对于一些实数 t，在第一种情况下，读取第一行(例如)而不是第一列将得到 [cos(t), sin(t) ] 代替 [cos(t), -sin(t)]。这解释了您看到的明显反射。

替换行

largest_eig_vec = eig_vecs[largest_index]

与

largest_eig_vec = eig_vecs[:, largest_index]

您应该会得到预期的结果。

关于python - 二维 PCA 线拟合与 numpy，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37726858/

33

4

0

文章推荐： python - 如何获取 Tensorflow seq2seq 嵌入输出

文章推荐： Python: AttributeError: 'NoneType' 对象没有属性 'rfind'

文章推荐： python - XlsxWriter 和 Python 继承

文章推荐： python - 我可以将 MathJax 集成到 Python 程序中吗？

pca - 使用 PCA 的边界框
我尝试用 PCA 构建一个定向边界框。在图片中您可以看到我的结果: 红点:点云蓝色向量:PCA 分量我尝试将点投影到向量上，以获得最小值、最大值和平均值。但是我现在如何定义我的盒子呢？有什么想法
java - PCA pca = 新PCA
我们如何将 PCA 应用于一维数组？ double[][] data = new double [1][600]; PCA pca = new PCA(data, 20); data = pca.ge
pca - 什么时候使用 ICA 而不是 PCA？
我知道PCA和ICA都用于降维，并且在PCA中主成分是正交的(不一定独立)，但在ICA中它们是独立的。有人能澄清一下什么时候使用 ICA 而不是 PCA 更好吗？最佳答案 ICA 不是一种降维技术。
pca - scikit-learning 如何对 libsvm 格式的稀疏数据执行 PCA？
我正在使用 scikit-learning 做一些降维任务。我的训练/测试数据采用 libsvm 格式。它是一个有 50 万列的大型稀疏矩阵。我使用 load_svmlight_file 函数加载
python - PCA 与 sklearn。无法使用 PCA 找出特征选择
我一直在尝试使用 PCA 进行降维。我目前有一个大小为 (100, 100) 的图像，我正在使用一个由 140 个 Gabor 滤波器组成的滤波器组，其中每个滤波器都会给我一个响应，这又是一个 (10
python - sklearn 上的 PCA - 如何解释 pca.components_
我使用以下简单代码在具有 10 个特征的数据框上运行 PCA: pca = PCA() fit = pca.fit(dfPca) pca.explained_variance_ratio_ 的结果显示
python - Orange PCA 和 scikit-learn PCA 之间的不同结果
我正在使用 scikit-learn PCA查找具有大约 20000 个特征和 400 多个样本的数据集的主要成分。但是，与Orange3 PCA相比应该使用 scikit-learn PCA，我得
python - Sklearn PCA 是 pca.components_ 的 loadings？
Sklearn PCA 是 pca.components_ 的 loadings？我很确定是这样，但我正在尝试遵循一篇研究论文，但我从他们的加载中得到了不同的结果。我在 sklearn 文档中找不到它
r - R 中的 PCA 使用 caret 包与 prcomp PCA
我有一个包含 50 多个变量的数据框 data，我正在尝试使用 caret 包在 R 中执行 PCA。 library(caret) library(e1071) trans <- preProces
python - 如何使用 Robust PCA 输出作为传统 PCA 的主成分(特征)向量
我正在使用 PCA 来降低 N 维数据集的维数，但我想增强对大异常值的稳健性，因此我一直在研究 Robust PCA 代码。对于传统的 PCA，我使用的是 python 的 sklearn.deco
apache-spark - Pyspark 和 PCA : How can I extract the eigenvectors of this PCA? 如何计算它们解释的方差？
我正在降低 Spark DataFrame 的维度与 PCA带有 pyspark 的模型(使用 spark ml 库)如下: pca = PCA(k=3, inputCol="features", o
python - 使用 python 的 sklearn 和 matlab 的 pca 的 PCA 的不同结果
我在 matlab 和 python 中生成相同的矩阵: 1 2 3 4 5 6 7 8 9 10 11 12 13
聊聊基于Alink库的主成分分析(PCA)
概述主成分分析（Principal Component Analysis，PCA）是一种常用的数据降维和特征提取技术，用于将高维数据转换为低维的特征空间。其目标是通过线性变换将原始特征转化为
主成分分析(PCA)介绍
目录计算过程投影分量计算假设你有一家理发店,已经记录了过去一年中所有顾客的头发长度和发型偏好的数据。现在你想从这些数据中提取一些主要的信息,比如顾客最常
python - 我是否必须分别为训练和测试数据做拟合 PCA
我正在考虑使用 PCA(TruncatedSVD) 来减少我的稀疏矩阵的维数。我将我的数据拆分为训练和测试拆分。 X_train , X_test, y_train, y_test = train_
r - 如何对具有多个组的数据集对每个组进行 PCA？
我有来自四个群体、四个处理和三个重复的个体数据集。每个个体仅在一个群体、处理和重复组合中。我对每个人进行了四次测量。我想对每个种群、底物和重复组合的这些测量进行 PCA。我知道如何对所有个体进行 P
python - PCA - 取平均值的差异
在考虑均值时，数字 1 和 2 背后的直觉是什么？这将如何影响性能和准确性？ 1号: pca = decomposition.PCA(n_components=4) X_centere
Scikit-Learn PCA
我正在使用来自 here 的输入数据(见第 3.1 节)。我正在尝试使用 scikit-learn 重现它们的协方差矩阵、特征值和特征向量。但是，我无法重现数据源中显示的结果。我也在别处看到过这个输
r - pca - 哪个特征向量对应于哪个特征值
我要做的事情如下:我有一套 Vektors v1-vn对于这些，我需要协方差矩阵(我在做 pca 时得到的)。我还需要协方差矩阵的特征值和特征向量。我按降序对特征值进行排序，然后根据相应的特征值对特征
OpenCV PCA 不可初始化
给定 http://docs.opencv.org/modules/core/doc/operations_on_arrays.html PCA 应该可以通过传递一个矩阵来初始化。 cv::Mat m

首页

博学

6Ren·AI

商城

python - 二维 PCA 线拟合与 numpy