gpt4 book ai didi

r - PCA:为什么我从 princomp() 和 prcomp() 得到如此不同的结果?

转载 作者:行者123 更新时间:2023-11-30 09:01:00 27 4
gpt4 key购买 nike

在下面的代码中,pc3$loadingspc4$rotation 之间有什么区别?

代码:

pc3<-princomp(datadf, cor=TRUE)
pc3$loadings

pc4<-prcomp(datadf,cor=TRUE)
pc4$rotation

数据:

datadf<-dput(datadf)
structure(list(gVar4 = c(11, 14, 17, 5, 5, 5.5, 8, 5.5,
6.5, 8.5, 4, 5, 9, 10, 11, 7, 6, 7, 7, 5, 6, 9, 9, 6.5, 9, 3.5,
2, 15, 2.5, 17, 5, 5.5, 7, 6, 3.5, 6, 9.5, 5, 7, 4, 5, 4, 9.5,
3.5, 5, 4, 4, 9, 4.5), gVar1 = c(0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L), gVar2 = c(0L,
1L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 1L, 1L, 1L, 1L, 0L, 1L, 1L, 0L,
2L, 3L, 0L, 0L, 1L, 0L, 0L, 1L, 1L, 0L, 1L, 0L, 0L, 0L, 1L, 0L,
0L, 1L, 0L, 1L, 1L, 0L, 0L, 0L, 0L, 1L, 1L, 1L, 0L, 1L, 0L, 0L
), gVar3 = c(2L, 4L, 1L, 3L, 3L, 2L, 1L, 2L, 3L, 6L, 5L,
2L, 7L, 4L, 2L, 7L, 5L, 6L, 1L, 3L, 3L, 6L, 3L, 2L, 3L, 1L, 1L,
1L, 1L, 1L, 2L, 5L, 4L, 5L, 6L, 5L, 5L, 6L, 7L, 6L, 2L, 5L, 8L,
5L, 5L, 0L, 2L, 4L, 2L)), .Names = c("gVar4", "gVar1",
"gVar2", "gVar3"), row.names = c(1L, 2L, 3L, 4L,
5L, 6L, 7L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 16L, 17L, 18L,
19L, 20L, 21L, 22L, 23L, 24L, 25L, 26L, 27L, 28L, 29L, 30L, 31L,
32L, 33L, 34L, 35L, 36L, 37L, 38L, 39L, 40L, 41L, 42L, 43L, 44L,
45L, 46L, 47L, 48L, 49L, 50L), class = "data.frame", na.action = structure(8L, .Names = "8", class = "omit"))

最佳答案

这样做时您没有收到警告吗pc4 <- prcomp(datadf, cor = TRUE) ?您应该被告知 prcomp没有cor争论,并且它被忽略。我将首先告诉您正确的做法,并解释原因。

正确做法

你应该这样做:

pc3 <- princomp(datadf, cor = TRUE)
pc4 <- prcomp(datadf, scale = TRUE)

然后两者都会在 pc3$sdev 中为您提供相同的根特征/奇异值和pc4$sdev ,以及 pc3$loadings 中相同的特征向量(载荷/旋转)和pc4$rotation .

为什么

当你这样做时pc3 <- princomp(datadf, cor = TRUE) ,您正在执行相关矩阵的特征分解:

foo <- eigen(cor(datadf))  ## cor()
foo$values <- sqrt(foo$values)
foo
#$values
#[1] 1.1384921 1.0614224 0.9249764 0.8494921

#$vectors
# [,1] [,2] [,3] [,4]
#[1,] 0.3155822 -0.6186905 0.70263064 0.1547260
#[2,] -0.4725640 0.4633071 0.68652912 -0.3011769
#[3,] -0.4682583 -0.6040654 -0.18558974 -0.6175724
#[4,] -0.6766279 -0.1940969 -0.02333235 0.7098991

这些是您将从pc3$sdev获得的内容和pc3$loadings .

但是,当您这样做时pc4 <- prcomp(datadf, cor = TRUE) , cor = TRUE被忽略,R 会做:

pc4 <- prcomp(datadf)  ## with default, scale = FALSE

因此它将执行协方差矩阵的奇异值分解:

bar <- eigen(cov(datadf))  ## cov()
bar$values <- sqrt(bar$values)
bar
#$values
#[1] 3.440363 2.048703 0.628585 0.196056

#$vectors
[,1] [,2] [,3] [,4]
#[1,] 0.997482373 -0.06923771 0.01349921 0.007268119
#[2,] -0.008316998 -0.01265655 0.01132874 0.999821133
#[3,] 0.007669026 -0.08271789 -0.99649018 0.010307681
#[4,] -0.070006635 -0.99408435 0.08183363 -0.014093521

这些是您将在 pc4$sdev 中看到的内容和pc4$rotation .

但是如果你这样做pc4 <- prcomp(datadf, scale = TRUE) ,它将对相关矩阵进行运算,与 pc3 <- princomp(datadf, cor = TRUE) 相同.

关于r - PCA:为什么我从 princomp() 和 prcomp() 得到如此不同的结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37349662/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com