python - 在 sklearn.decomposition.PCA 中，为什么 components

python - 在 sklearn.decomposition.PCA 中，为什么 components_ 是负的？

转载作者：太空狗更新时间：2023-10-29 17:32:16

26

4

我正在尝试跟随 Abdi & Williams - Principal Component Analysis (2010) 并通过 SVD 构建主成分，使用 numpy.linalg.svd .

当我显示 components_ 时来自带有 sklearn 的拟合 PCA 的属性，它们与我手动计算的那些大小完全相同，但一些(不是全部)符号相反。这是什么原因造成的？

更新:我在下面的(部分)回答包含一些额外的信息。

采用以下示例数据:

from pandas_datareader.data import DataReader as dr
import numpy as np
from sklearn.decomposition import PCA
from sklearn.preprocessing import scale

# sample data - shape (20, 3), each column standardized to N~(0,1)
rates = scale(dr(['DGS5', 'DGS10', 'DGS30'], 'fred', 
           start='2017-01-01', end='2017-02-01').pct_change().dropna())

# with sklearn PCA:
pca = PCA().fit(rates)
print(pca.components_)
[[-0.58365629 -0.58614003 -0.56194768]
 [-0.43328092 -0.36048659  0.82602486]
 [-0.68674084  0.72559581 -0.04356302]]

# compare to the manual method via SVD:
u, s, Vh = np.linalg.svd(np.asmatrix(rates), full_matrices=False)
print(Vh)
[[ 0.58365629  0.58614003  0.56194768]
 [ 0.43328092  0.36048659 -0.82602486]
 [-0.68674084  0.72559581 -0.04356302]]

# odd: some, but not all signs reversed
print(np.isclose(Vh, -1 * pca.components_))
[[ True  True  True]
 [ True  True  True]
 [False False False]]

最佳答案

正如您在回答中了解到的，奇异值分解 (SVD) 的结果在奇异向量方面并不是唯一的。实际上，如果 X 的 SVD 是\sum_1^r\s_i u_i v_i^\top :

随着 s_i 以递减方式排序，然后您可以看到您可以更改 u_1 和 v_1 的符号(即“翻转”)，减号将取消，因此公式仍然有效。

这表明 SVD 是唯一的直到左右奇异向量对的符号发生变化。

由于 PCA 只是 X 的 SVD(或 X^\top X 的特征值分解)，因此无法保证每次执行时都不会在同一 X 上返回不同的结果。可以理解的是，scikit learn 实现想要避免这种情况:他们保证返回的左右奇异向量(存储在 U 和 V 中)始终相同，通过强加(这是任意的)绝对值中 u_i 的最大系数为正.

如您所见阅读the source :首先，他们使用 linalg.svd() 计算 U 和 V。然后，对于每个向量 u_i(即 U 的行)，如果其绝对值中的最大元素为正，则它们什么都不做。否则，他们将 u_i 更改为 - u_i，并将相应的左奇异向量 v_i 更改为 - v_i。如前所述，这不会更改 SVD 公式，因为减号抵消了。但是，现在可以保证经过此处理后返回的 U 和 V 始终相同，因为符号上的不确定性已被删除。

关于python - 在 sklearn.decomposition.PCA 中，为什么 components_ 是负的？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44765682/

26

4

0

文章推荐： c# - 在启用滚动的文本框中禁用版本

文章推荐： c# - ItextSharp - 使用 C# 自动填写 pdf 表单 - 复选框问题

文章推荐： c# - WPF前要不要学Window Form？

文章推荐： python - 如何在 Jupyter Notebook 或 JupyterLab 中使用破折号？

php - 负(负)零等于 0 在 PHP 中吗？
我有一个非常基本的 MySQL 查询，它从数据库表中读取行并将行值添加或减去定义为 $total_balance 的 PHP 字符串。例如； $statement_details_query = m
html - 负 margin-left 工作正常，负 margin-right 创建滚动条
我有 following fiddle ，请注意，如果您使输出的宽度变小，图像将被覆盖并且不会出现滚动条 - 完美。如果我attempt the same effect on the right ，
python正则表达式向前看正+负
这个正则表达式将得到 456。我的问题是为什么它不能是 1-234-56 中的 234 ？ 56 是否限定 (?!\d)) 模式，因为它不是单个数字。 (?!\d)) 寻找的起始点在哪里？ impor
c - 指针差异类型(负)
我需要知道两个子结构之间的内存距离 (&my_type.a - &my_tape.b.c) 结果的类型是什么？我需要将它转换为 (signed int)，所以显然它是别的东西。最佳答案根据 C11
java - 负 serialVersionUID？
我遇到了一个扩展异常的异常处理程序类，如下所示: public class AppFileReaderException extends Exception { //Explicit seri
c++ - 负 RGB 值
如何可视化负 RGB 值？根据 OpenCV 文档: CV_8S - 8 位有符号整数 (-128..127) 这是否意味着 -128 表示 0 而 127 表示 255？如果是，那我们为什么需要
java - 子字符串尝试处理错误(负)索引
我这里有一段代码给我带来了麻烦: idIndex = panoBuffer.indexOf("\"photo_id\":"); System.out.println(idIndex);
java - 计算胜/负、胜率和总胜率
我刚刚练习 Java，对此还很陌生。我只是想创建一个随机数生成器程序来跟踪玩家的获胜、失败、获胜百分比和总获胜金额。该程序的逻辑是，玩家每次 session 有 3 次机会，计算机会生成一个随机数，玩
检查输入是否为数字、是否带小数点、或正/负
因此，我们被要求创建一个程序，使用户能够从 1-6 个有关矩阵运算的选项中进行选择。在每个用户的输入中，我们需要检查该输入是否适合要完成的操作(程序应该接受整数或 float ，正数或负数)。如果不满
c - 输出保持在同一列，忽略 "-"(负)
这是我期望的输出 x |x| 1.2 1.2 -2.3 2.3 3.4 3.4 但我一直收到这个: x |x| 1
php - 打印正/负 date_diff
假设我有这个: $date1=date_create(date('H:I', strtotime('8:00'))); $date2=date_create(date('H:I', strtotime
ruby - 负 FixNum 的无符号等价物
如何确定负 FixNum 的无符号解释？ # unexpected, true (~0b01111011).to_s(2) == ("-" + (~0b01111011).abs.to_s(2)) #
php - 负 SQL 查询
这是一个用于“邀请您的 friend 加入此群组”脚本的快速 SQL 查询。我有 2 个表:users 和 group_members。我正在尝试执行一个查询，选择我所有的 friend ——由第一
c++ - 负 ASCII 值
负 ASCII 值有什么意义？ int a = '«'; //a = -85 but as in ASCII table '<<' should be 174 最佳答案没有负数ASCII值。 ASC
mysql - 我如何选择每支球队的最后五场比赛并确定胜/负/平局？
我知道用 PHP 可以做到这一点，但是有没有办法只用 MySQL 来做到这一点？我有这个数据库: --------------------------------------------------
php - 负 float 日期
我在变量中有一个时间戳 $data = (float) -2208988800; 是否可以根据这些数据创建正确的日期？date("d.M.Y", $data) 返回“07.02.2036” 最佳答案
c# - 将括号(负)转换为双
你好我如何将括号格式的负值转换为 double 值。目前我有这个。 Payment.Text = Calc_Payment().ToString("#,##0.00;(#,##0.00)"); 将支付
位域与(负)整数、未定义行为或编译器错误的比较？
这是一个小程序。这应该打印 0 或 1，还是它有未定义的行为？ #include struct S0 { unsigned f1 : 1; }; struct S0 s; int main (v
python - 负 'Start training from score'
运行 lgb.cv 时，我有时会从日志中看到“从分数开始训练”后的负数。想知道这个数字到底是什么意思，单位是什么？是根据参数中指定的指标吗？以下是摘录: [LightGBM] [Info] Total
python - Tensorflow，负 KL 散度
我正在使用变分自动编码器类型模型，我的损失函数的一部分是均值为 0 和方差为 1 的正态分布与另一个均值和方差由我的模型预测的正态分布之间的 KL 散度。我用以下方式定义了损失: def kl_lo

首页

博学

6Ren·AI

商城

python - 在 sklearn.decomposition.PCA 中，为什么 components_ 是负的？