gpt4 book ai didi

r - 通过奇异值分解求解普通最小二乘的Toy R函数

转载 作者:行者123 更新时间:2023-12-04 12:49:57 25 4
gpt4 key购买 nike

我正在尝试使用矩阵的奇异值分解编写用于多元回归分析 (y = Xb + e) 的函数。 yX必须是输入和回归系数向量b,残差向量e和方差占R2 作为输出。下面是我到目前为止所拥有的,我完全被困住了。重量的 labels 部分也给我一个错误。这个 labels 部分是什么?任何人都可以给我一些提示以帮助我继续吗?

Test <- function(X, y) {
x <- t(A) %*% A
duv <- svd(x)
x.inv <- duv$v %*% diag(1/duv$d) %*% t(duv$u)
x.pseudo.inv <- x.inv %*% t(A)
w <- x.pseudo.inv %*% labels
return(b, e, R2)
}

最佳答案

你偏离了道路...奇异值分解应用于模型矩阵 X 而不是普通矩阵 X'X。以下是正确的步骤:

svd for ols

所以在写R函数的时候,我们应该这样做

svdOLS <- function (X, y) {
SVD <- svd(X)
V <- SVD$v
U <- SVD$u
D <- SVD$d
## regression coefficients `b`
## use `crossprod` for `U'y`
## use recycling rule for row rescaling of `U'y` by `D` inverse
## use `as.numeric` to return vector instead of matrix
b <- as.numeric(V %*% (crossprod(U, y) / D))
## residuals
r <- as.numeric(y - X %*% b)
## R-squared
RSS <- crossprod(r)[1]
TSS <- crossprod(y - mean(y))[1]
R2 <- 1 - RSS / TSS
## multiple return via a list
list(coefficients = b, residuals = r, R2 = R2)
}

我们来做个测试

## toy data
set.seed(0)
x1 <- rnorm(50); x2 <- rnorm(50); x3 <- rnorm(50); y <- rnorm(50)
X <- model.matrix(~ x1 + x2 + x3)

## fitting linear regression: y ~ x1 + x2 + x3
svdfit <- svdOLS(X, y)

#$coefficients
#[1] 0.14203754 -0.05699557 -0.01256007 0.09776255
#
#$residuals
# [1] 1.327108410 -1.400843739 -0.071885339 2.285661880 0.882041795
# [6] -0.535230752 -0.927750996 0.262674650 -0.133878558 -0.559783412
#[11] 0.264204296 -0.581468657 2.436913000 1.517601798 0.774515419
#[16] 0.447774149 -0.578988327 0.664690723 -0.511052627 -1.233302697
#[21] 1.740216739 -1.065592673 -0.332307898 -0.634125164 -0.975142054
#[26] 0.344995480 -1.748393187 -0.414763742 -0.680473508 -1.547232557
#[31] -0.383685601 -0.541602452 -0.827267878 0.894525453 0.359062906
#[36] -0.078656943 0.203938750 -0.813745178 -0.171993018 1.041370294
#[41] -0.114742717 0.034045040 1.888673004 -0.797999080 0.859074345
#[46] 1.664278354 -1.189408794 0.003618466 -0.527764821 -0.517902581
#
#$R2
#[1] 0.008276773

另一方面,我们可以使用.lm.fit来检查正确性:

qrfit <- .lm.fit(X, y)

这在系数和残差上完全相同:

all.equal(svdfit$coefficients, qrfit$coefficients)
# [1] TRUE

all.equal(svdfit$residuals, qrfit$residuals)
# [1] TRUE

关于r - 通过奇异值分解求解普通最小二乘的Toy R函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40250072/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com