gpt4 book ai didi

r - 模型摘要中有序和无序因子与数值预测变量的解释

转载 作者:行者123 更新时间:2023-12-04 16:24:23 24 4
gpt4 key购买 nike

我安装了一个模型,其中:

Y ~ A + A^2 + B + 混合效果(C)

Y 是连续的
A 是连续的
B 实际上指的是 DAY,目前看起来像这样:

Levels: 1 < 2 < 3 < 4 < 5 < 6 < 7 < 8 < 9 < 11 < 12

我可以轻松更改数据类型,但我不确定将 B 视为数字、因子或有序因子是否更合适。并且当被视为数字或有序因子时,我不太确定如何解释输出。

当作为有序因子处理时,summary(my.model) 输出如下内容:
Linear mixed model fit by REML ['lmerMod']
Formula: Y ~ A + I(A^2) + B + (1 | mixed.effect.C)
Fixed effects:
Estimate Std. Error t value
(Intercept) 19.04821 0.40926 46.54
A -151.01643 7.19035 -21.00
I(A^2) 457.19856 31.77830 14.39
B.L -3.00811 0.29688 -10.13
B.Q -0.12105 0.24561 -0.49
B.C 0.35457 0.24650 1.44
B^4 0.09743 0.24111 0.40
B^5 -0.08119 0.22810 -0.36
B^6 0.19640 0.22377 0.88
B^7 0.02043 0.21016 0.10
B^8 -0.48931 0.20232 -2.42
B^9 -0.43027 0.17798 -2.42
B^10 -0.13234 0.15379 -0.86

什么是 L、Q 和 C?我需要知道每增加一天 (B) 对响应 (Y) 的影响。如何从输出中获取此信息?

当我将 B 视为.numeric 时,输出如下:
    Fixed effects:
Estimate Std. Error t value
(Intercept) 20.79679 0.39906 52.11
A -152.29941 7.17939 -21.21
I(A^2) 461.89157 31.79899 14.53
B -0.27321 0.02391 -11.42

为了获得每增加一天 (B) 对响应 (Y) 的影响,我是否应该将 B 乘以 B(天数)的系数?不知道如何处理这个输出......

最佳答案

这实际上并不是一个混合模型的特定问题,而是一个关于 R 中模型参数化的一般问题。

让我们尝试一个简单的例子。

set.seed(101)
d <- data.frame(x=sample(1:4,size=30,replace=TRUE))
d$y <- rnorm(30,1+2*d$x,sd=0.01)

x 作为数字

这只是做一个线性回归: x参数表示 y的变化每单位变化 x ;截距指定了 y 的预期值在 x=0 .
coef(lm(y~x,d))
## (Intercept) x
## 0.9973078 2.0001922

x 作为(无序/常规)因子
coef(lm(y~factor(x),d))
## (Intercept) factor(x)2 factor(x)3 factor(x)4
## 3.001627 1.991260 3.995619 5.999098

截距指定了 y 的预期值在因子的基线水平( x=1 );其他参数指定 y 的预期值之间的差异当 x取其他值。

x 作为有序因子
coef(lm(y~ordered(x),d))
## (Intercept) ordered(x).L ordered(x).Q ordered(x).C
## 5.998121421 4.472505514 0.006109021 -0.003125958

现在截距指定了 y 的值在平均因子水平(介于 2 和 3 之间); L (linear) 参数给出了线性趋势的度量(不太确定我可以解释特定值...), QC指定二次和三次项(在这种情况下接近于零,因为模式是线性的);如果有更多级别,高阶对比度将编号为 5、6、...

逐次差对比
coef(lm(y~factor(x),d,contrasts=list(`factor(x)`=MASS::contr.sdif)))
## (Intercept) factor(x)2-1 factor(x)3-2 factor(x)4-3
## 5.998121 1.991260 2.004359 2.003478

这种对比将参数指定为连续级别之间的差异,这些参数都是(大约)2 的常数值。

关于r - 模型摘要中有序和无序因子与数值预测变量的解释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25735636/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com