gpt4 book ai didi

r - glmnet 包中的类型测量差异?

转载 作者:行者123 更新时间:2023-12-05 05:17:14 24 4
gpt4 key购买 nike

在 glmnet 包中使用“mse”和“class”有什么区别?

log_x <- model.matrix(response~.,train)
log_y <- ifelse(train$response=="good",1,0)
log_cv <- cv.glmnet(log_x,log_y,alpha=1,family="binomial", type.measure = "class")
summary(log_cv)
plot(log_cv)

对比

log_x <- model.matrix(response~.,train)
log_y <- ifelse(train$response=="good",1,0)
log_cv <- cv.glmnet(log_x,log_y,alpha=1,family="binomial", type.measure = "mse")
summary(log_cv)
plot(log_cv)

我注意到我得到的曲线略有不同,或者我的绘图中的平滑度,以及几个 % 的准确性差异。但是对于预测二项式类响应,一种类型的度量比另一种更合适?

最佳答案

这取决于您的案例研究以及您想从模型中学到什么。来自帮助文件

The default is type.measure="deviance", which uses squared-error for gaussian models (a.k.a type.measure="mse" there) [...]. type.measure="class" applies to binomial and multinomial logistic regression only, and gives misclassification error

因此,您必须问问自己,在您的问题中,您是想最小化误分类误差还是均方误差。

对于哪个最好,没有直接的答案。它们是两种不同的统计数据,在给定交叉验证生成的不同模型的情况下,模型根据这些统计数据决定最佳惩罚参数是什么。

关于r - glmnet 包中的类型测量差异?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49535204/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com