gpt4 book ai didi

python - PCA的主要成分

转载 作者:行者123 更新时间:2023-11-28 21:32:36 24 4
gpt4 key购买 nike

我在 datacamp.com 中遇到了这个问题:
下面是同一点云的三个散点图。每个散点图显示一组不同的轴(红色)。在哪张图中,轴可以代表点云的主要组成部分?

还记得主成分是数据变化的方向吗?

答案:图 1 和图 3

我的问题是这个问题是什么意思?为什么图 2 不是答案的一部分,因为轴可以旋转以适合点云。

enter image description here

最佳答案

正如评论中所建议的,这更适合交叉验证,或者可能是 math.stackexchange。

现在直观上答案相当简单。

主要组件可以通过迭代过程获得:

  1. 第一个主成分相当于线性组合 a_1 %*% X,它根据 t(a_1) 最大化 Var(a_1 %*% X) ) %*% a_1 = 1
  2. 第二个主成分相当于线性组合 a_2 %*% X,它在 t(a_2) 的条件下最大化 Var(a_2 %*% X) ) %*% a_2 = 1cov(a_1 %*% X, a_2 %*% X) = 0
  3. 第三个 -- || --

从这个定义中可以看出,var(a_1 %*% X) = var( - a_1 %*% X),因此主成分仅取决于成分的符号。

从这个定义我们可以看出: 1. 1 和 3 是等价的,因为第一条(最长)线位于点最分散的方向(显示最大方差) 2.第二个图不能是主成分,因为方向与最大方差的方向不一致

Applied Multivariate Statistical Analysis 第 8 章,第 430 页(左右)包含更详细的理论解释。

关于python - PCA的主要成分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56110151/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com