gpt4 book ai didi

r - glmnet 如何计算最大 lambda 值?

转载 作者:行者123 更新时间:2023-12-01 22:56:49 25 4
gpt4 key购买 nike

glmnet 包使用一系列 LASSO 调整参数 lambda,这些参数是从最大 lambda_max 缩放而来的,在该参数下,没有选择预测变量。我想了解 glmnet 如何计算这个 lambda_max 值。例如,在一个简单的数据集中:

set.seed(1)
library("glmnet")
x <- matrix(rnorm(100*20),100,20)
y <- rnorm(100)
fitGLM <- glmnet(x,y)
max(fitGLM$lambda)
# 0.1975946

包 vignette ( http://www.jstatsoft.org/v33/i01/paper ) 在第 2.5 节中描述了它计算该值的方式如下:

sx <- as.matrix(scale(x))
sy <- as.vector(scale(y))
max(abs(colSums(sx*sy)))/100
# 0.1865232

这显然很接近,但不是相同的值。那么,是什么原因造成这种差异呢?在一个相关问题中,我如何计算逻辑回归的lambda_max

最佳答案

要获得相同的结果,您需要使用标准差以 n 而不是 n-1 分母来标准化变量。

mysd <- function(y) sqrt(sum((y-mean(y))^2)/length(y))
sx <- scale(x,scale=apply(x, 2, mysd))
sx <- as.matrix(sx, ncol=20, nrow=100)
sy <- as.vector(scale(y, scale=mysd(y)))
max(abs(colSums(sx*sy)))/100
## [1] 0.1758808
fitGLM <- glmnet(sx,sy)
max(fitGLM$lambda)
## [1] 0.1758808

对于未缩放的(原始)xy,最大 lambda 应为

mysd <- function(y) sqrt(sum((y-mean(y))^2)/length(y))
sx <- scale(x,scale=apply(x, 2, mysd))
norm(t(sx) %*% y, 'i') / nrow(x)
## [1] 0.1975946
# norm of infinity is also equal to
max(abs(colSums(sx*y)))/100
## [1] 0.1975946
max(fitGLM$lambda) - norm(t(sx) %*% y, 'i') / nrow(x)
## [1] 2.775558e-17

关于r - glmnet 如何计算最大 lambda 值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25257780/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com