r - lmer(来自 R 包 lme4)如何计算对数似然？-6ren

r - lmer(来自 R 包 lme4)如何计算对数似然？

转载作者：行者123 更新时间：2023-12-01 23:31:59

我正在尝试理解 lmer 函数。我找到了大量关于如何使用该命令的信息，但关于它实际执行的操作的信息却很少(除了这里的一些神秘注释: http://www.bioconductor.org/help/course-materials/2008/PHSIntro/lme4Intro-handout-6.pdf )。我正在使用以下简单示例:

library(data.table)
library(lme4)
options(digits=15)

n<-1000
m<-100
data<-data.table(id=sample(1:m,n,replace=T),key="id")
b<-rnorm(m)
data$y<-rand[data$id]+rnorm(n)*0.1
fitted<-lmer(b~(1|id),data=data,verbose=T)
fitted

据我了解，lmer 正在拟合 Y_{ij} = beta + B_i + epsilon_{ij} 形式的模型，其中 epsilon_{ij} 和 B_i 是独立法线，分别具有方差 sigma^2 和 tau^2。如果 theta = tau/sigma 是固定的，我用正确的均值和最小方差计算出 beta 的估计值

c = sum_{i,j} alpha_i y_{ij}

哪里

alpha_i = lambda/(1 + theta^2 n_i)
lambda = 1/[\sum_i n_i/(1+theta^2 n_i)]
n_i = number of observations from group i

~~我还计算了以下 sigma^2 的无偏估计:~~

~~s^2 =\sum_{i,j} alpha_i (y_{ij} - c)^2/(1 + theta^2 - lambda)~~

这些估计似乎与 lmer 的结果一致。但是，我无法弄清楚在这种情况下如何定义对数似然。我计算出概率密度为

pd(Y_{ij}=y_{ij}) = \prod_{i,j}[f_sigma(y_{ij}-ybar_i)]
    * prod_i[f_{sqrt(sigma^2/n_i+tau^2)}(ybar_i-beta) sigma sqrt(2 pi/n_i)]

哪里

ybar_i = \sum_j y_{ij}/n_i (the mean of observations in group i)
f_sigma(x) = 1/(sqrt{2 pi}sigma) exp(-x^2/(2 sigma)) (normal density with sd sigma)

但是上面的日志不是 lmer 生成的。在这种情况下如何计算对数似然(对于奖励分数，为什么)？

编辑:更改了一致性符号，删除了标准偏差估计的错误公式。

最佳答案

评论中的链接包含了答案。下面我将公式简化后的内容放在这个简单的示例中，因为结果有些直观。

lmer 适合 $Y_{ij} = \beta + B_i + \epsilon_{ij}$ 形式的模型，其中 $\epsilon_{ij}$ 和 $B_i$ 是具有方差的独立正态分布 $\sigma^2$ 和 $\tau^2$ 分别。 $Y_{ij}$ 的联合概率分布和 $B_i$ 因此是

$\left(\prod_{i,j}f_{\sigma^2}(y_{ij}-\beta-b_i)\right)\left(\prod_i f_{\tau^2}(b_i)\right)$

哪里

$f_{\sigma^2}(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{x^2}{2\sigma^2}}$ .

通过将其与 $b_i$ 积分来获得可能性。 (未观察到)给予

$\left(\prod_{i,j}f_{\sigma^2}(y_{ij}-\bar y_i)\right)\left(\prod_i f_{\sigma^2/n_i+\tau^2}(\bar y_i-\beta)\sqrt{2\pi\sigma^2/n_i}\right)$

哪里 $n_i$ 是组 $i$ 的观察数，和 $\bar y_i$ 是组 $i$ 观察值的平均值。这有点直观，因为第一项捕获了每个组内的分布，应该有方差 $\sigma^2$ ，第二个捕获组之间的传播。请注意 $\sigma^2/n_i+\tau^2$ 是 $\bar y_i$ 的方差.

但是，默认情况下 (REML=T) lmer 不是最大化可能性，而是最大化“REML 标准”，这是通过将其与 $\beta$ 进行额外积分而获得的。给予

$\left(\prod_{i,j}f_{\sigma^2}(y_{ij}-\bar y_i)\right)\left(\prod_i f_{\sigma^2/n_i+\tau^2}(\bar y_i-\hat\beta)\sqrt{2\pi\sigma^2/n_i}\right)\sqrt{\frac{2\pi\sigma^2}{\sum_i\frac{n_i}{1+n_i\theta^2}}}$

哪里 $\hat\beta$ 下面给出。

最大化可能性 (REML=F)

如果 $\theta=\tau/\sigma$ 固定后，我们可以显式找到 $\beta$ 和 $\sigma$ 最大化可能性。事实证明他们是

$\hat\beta=\frac{\sum_{i,j}y_{ij}/(1+n_i\theta^2)}{\sum_i n_i/(1+n_i\theta^2)}$

$\hat\sigma^2=\frac{1}{n}\left(\sum_{i,j}(y_{ij}-\bar y_i)^2+\sum_i\frac{n_i}{1+n_i\theta^2}(\bar y_i-\hat\beta)^2\right)$

注意 $\hat\sigma^2$ 有两个术语表示组内和组间的变化，并且 $\hat\beta$ 介于 $y_{ij}$ 的平均值之间和 $\bar y_i$ 的平均值取决于 $\theta$ 的值.

将这些代入似然，我们可以表示对数似然 $l$ 就 $\theta$ 而言仅:

$-2l=\sum_i\log(1+n_i\theta^2)+n(1+\log(2\pi\hat\sigma^2))$

lmer 迭代查找 $\theta$ 的值这最大限度地减少了这种情况。在输出中， $-2l$ 和 $l$ 分别显示在“偏差”和“logLik”字段中(如果 REML=F)。

最大化限制似然 (REML=T)

因为 REML 标准不依赖于 $\beta$ ，我们对 $\beta$ 使用相同的估计如上。我们估计 $\sigma$ 最大化 REML 标准:

$\hat\beta=\frac{\sum_{i,j}y_{ij}/(1+n_i\theta^2)}{\sum_i n_i/(1+n_i\theta^2)}$

$\hat\sigma^2=\frac{1}{n-1}\left(\sum_{i,j}(y_{ij}-\bar y_i)^2+\sum_i\frac{n_i}{1+n_i\theta^2}(\bar y_i-\hat\beta)^2\right)$

受限对数似然 $l_R$ 由下式给出:

$-2l_R=\sum_i\log(1+n_i\theta^2)+(n-1)(1+\log(2\pi\hat\sigma^2))+\log\left(\sum_i\frac{n_i}{1+n_i\theta^2}\right)$

在 lmer 的输出中， $-2l_R$ 和 $l_R$ 分别显示在“REMLdev”和“logLik”字段中(如果 REML=T)。

关于r - lmer(来自 R 包 lme4)如何计算对数似然？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20980116/

文章推荐： ios - 如何使用 UIWebView 强制 Vimeo 播放器内嵌播放？

文章推荐： file - 如何在Crystal中将二进制文件写入文件

文章推荐： visual-studio - Resharper 扩展管理器为空

文章推荐： java - PostgreSQL : syntax error at and near null

python 对数
我想在 python 中找出一个整数的 log10，但我得到了一个错误，比如数学域错误我的代码是这样的w=math.log10(q*q1)/math.log10(2) 其中 q1,q2 是整数是的
NumPy舍入小数、对数、求和和乘积运算详解
舍入小数在 NumPy 中，主要有五种方法来舍入小数：截断去除小数部分，并返回最接近零的浮点数。使用 trunc() 和 fix() 函数。示例： import numpy as n
javascript - 对数 slider
我有一个数值范围为 0 到 100 的 slider 。我想将它们映射到 100 到 10,000,000 的范围内。我在网上看到过一些函数，但它们都是用 C++ 编写的。我需要它在 Javasc
ada - 如何获得整数的 10 对数？
我想请用户输入一个整数(N)，然后显示他/她输入的整数的 10 对数。我已经成功计算了 10 对数，但不知道如何像下面这样显示它: Write in an Integer: 455666 455666
Zedgraph，对数 x 轴的值再次重复
我将 x 轴设置为对数刻度。最大值为10000，最小值为1。 GraphPane mypane = zedgraphcontrol.GraphPane; mypane.XAxis.Type = Axi
python - 对数 Gamma 函数的快速算法
我正在尝试编写一个快速算法来计算 log gamma function 。目前我的实现看起来很幼稚，只是迭代了 1000 万次来计算 gamma 函数的对数(我还使用 numba 来优化代码)。 im
python - 对数 y 轴使刻度标签消失
这个问题在这里已经有了答案: How to show minor tick labels on log-scale with Matplotlib (2 个答案) 关闭 7 年前。将行 plt.y
math - 自定义轴刻度 - "Reverse"对数？
抱歉标题不好 ;) 我正在尝试重新创建我在其他一些工作中遇到的 matlab 图，但我不太了解他们使用的比例。 y轴增量如下(从上往下[+ve y]): 0.9999,0.999,0.99,0.9,0
ruby 精确数对数(对数)函数
由于 1000 的以 10 为底的对数是 3，您可能期望 Math::log(1000, 10) 返回 3。相反，它返回 2.9999999999999996。这是因为 Ruby 中的 float
javascript - Highcharts 对数 X 轴在没有零值或阈值低于零或最小值的情况下失败
我对对数 X 轴有疑问。阈值大于 0，x 的最小值为 1，并且所有 X 值都大于 0。并且仍然给我相同的错误 Can't plot zero or subzero values on a logari
android - MPAndroidChart 对数 Y 轴
我需要在我的应用程序中实现折线图，我想使用 MPAndroidChart。问题是 y 轴上的值将介于 1 和 1x10^-12 之间。这就是为什么我需要在该轴上的对数 View 。有没有办法用那个库
javascript - 对数 slider 返回 NaN
我正在尝试按照 Logarithmic slider 中的示例进行操作. 这是我使用的代码: Timeline._MIN_PER_MINUTE = 1; Timeline._MIN_PER_HOUR
Java 对数 log(num, base)(已关闭)
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 9 年前。 Improve th
python - 对数 y 轴的 matplotlib 条形图
我尝试为对数 y 轴绘制条形图。不幸的是，如果我将 y 轴设置为对数，则不再有条形图。我该怎么做才能实现这一目标？是否可以在 bar-function 中设置引用点(默认似乎为零)？我的代码是: i
algorithm - Big Oh 对数(ish)复杂度计算
所以我一直在努力掌握 Big Oh 的计算方法。我觉得我已经掌握了基础知识，但对看似非常简单的计算感到困惑。所以如果下面的计算有很大的 O(n log n)(我真的希望我至少做对了)改变循环的顺序对复
matlab - 如何绘制(半)对数 3d 图？ (Matlab)
我知道二维绘图的 semilogx 和 semilogy。 SURF 和 MESH 有什么等价物吗？最佳答案如上述链接所述，要将所有三个轴设置为对数刻度，请使用 set(gca, 'XScale'
ruby - 在 Ruby 中计算 Base-n 对数
这看起来很简单，但我在用 Ruby 计算 log (Base 5) 时遇到了问题。显然标准的 base-10 日志工作正常: >> value = Math::log(234504) => 12.3
c - 关于 C 代码和 Pollard 对数 rho 算法的问题
这段代码是用 C 语言根据 pollard 的对数 rho 算法(来自 wiki)编写的。在此代码中，如果我输入 alpha=2、beta=5、N=1019，则必须返回 a=681、b=378、A=3
matlab - 如何在 Matlab 上的(半)对数 3d 图上获得漂亮的色标？
有了this question之后通过指向 an external site 的链接回答，我意识到我解决了一个问题，只是为了得到另一个问题:在对数刻度上，MESH 和 SURF 函数的 C=Z 参数不
c++ - 如何找到满足 GCD(a,b) = x 的 a,b
我正在尝试解决 the SPOJ problem PGCD , 它询问最大公约数表中出现了多少个素数。我想到的第一个想法是先通过筛分生成素数。然后，对于每个素数 p，查看有多少对(a，b)，其中

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城