r - 训练集上的 Predict.glmer 在有或没有新数据的情况下有所不同-6ren

r - 训练集上的 Predict.glmer 在有或没有新数据的情况下有所不同

转载作者：行者123 更新时间：2023-12-01 18:03:16

27

4

这可能更像是一个错误报告而不是一个问题，但是:为什么显式使用 newdata 参数来使用与训练数据相同的数据集进行预测有时会产生与省略 不同的预测>newdata 参数并明确使用训练数据集？

library(lme4)
packageVersion("lme4") # 1.1.8
m1 <- glmer(myformula, data=X, family="binomial")
p1 <- predict(m1, type="response")
p2 <- predict(m1, type="response", newdata=X)
all(p1==p2) # FALSE

这不仅仅是一个舍入错误。我看到 cor(p1,p2) 返回 0.8。

这似乎与具有斜坡的模型无关。在下图中，隐式表示预测(..., type="response")没有新数据，显式表示预测(..., type="response", newdata=X)，其中 X 与训练相同。模型 1 与其他模型的唯一区别在于模型 1 仅包含(随机)截距，而其他模型具有随机截距和随机斜率。

enter image description here

最佳答案

事实证明，这是 predict.merMod 中的一个错误，已在开发版本中修复(2014 年 11 月，为 this Github issue )。如果您安装了编译工具，您可以直接从 Github 安装开发版本

devtools::install_github("lme4/lme4")

关于r - 训练集上的 Predict.glmer 在有或没有新数据的情况下有所不同，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28356192/

27

4

0

文章推荐： Java List 的多态性问题

文章推荐： java - 将 Eclipse RCP 应用程序导出到可运行的 jar 文件

文章推荐： iphone - 如何在 iOS 设备上滑动手势期间 "catch" subview ？

文章推荐： xcode - Mac上可以有多个iOs版本吗？

r - glmer 的事后检验
我正在使用广义线性混合模型(glmer、lme4-package)用 R 分析我的二项式数据集。我想使用 Tukey 的事后测试(glht，multcomp-package)对某个固定效果(“声音”)
减小 glmer 模型大小
我是 R 新手，我正在使用 glmer 来拟合几个二项式模型，我只需要它们来调用 predict使用得到的概率。但是，我有一个非常大的数据集，即使只有一个模型的大小也会变得非常大: > library
r - glmer 输出的优势比和置信区间
我制作了一个模型，可以查看许多变量以及对怀孕结果的影响。结果是分组的二进制文件。一群动物有 34 只怀孕和 3 只空，接下来会有 20 只怀孕和 4 只空，以此类推。我使用 glmer 对这些数据进
r - 汇集估算数据集的 glmers
问题: 我有一个数据集，其中缺少一些预测变量值。我想将已应用于这些插补集的 glmer 模型汇集在一起。我使用 mice 包来创建插补(我也使用过 amelia 和 mi 但没有成功)。我想主要提
r - glmer 过度离散的模型检验和检验
我正在测试不同生境和柱头类型的植物柱头上花粉粒数量的差异。我的样本设计包括两个栖息地，每个栖息地有 10 个站点。在每个地点，我有多达 3 种柱头类型(湿、干和半干)，对于每种柱头类型，我有不同数
r - 使用 glmer 处理嵌套数据
我有关于跨纬度感染特定宿主物种的病原体多样性的数据。设计涉及在不同纬度的4个地点的3个地点收集20个人，因此我有20个人，嵌套在3个地点内，嵌套在4个地点内。鉴于我的病原体多样性数据是带有许多零的计
r - 二项式 glmer() 预测的分类精度
我一直在用我的(非 r-savvy)大脑来让 R 产生二项式 glmer 模型的正确预测的百分比。我知道这不是统计上的 super 信息，但经常被报道；所以我也想举报。数据: 因变量:Tipo，它有
r - 使用 glmer 提取随机效应分量的标准偏差
我正在使用 glmer 并且我希望提取随机效应(截距和斜率)的方差分量的标准偏差。我试过使用: VarCorr(model) 它返回两个标准偏差值(加上相关性)，但我只想提取截距和斜率 SD 值。
r - glmer-使用二项式数据预测(结合计数数据)
我正在尝试根据我的二项式数据运行的glmer模型随时间(x轴上的天数)预测值。 Total Alive和Total Dead是计数数据。这是我的模型，以及下面的相应步骤。 full.model.dre
r - 一般线性混合效应 (glmer) 异方差建模
我的变量是在一个带有二次抽样设计的随机块上测量的，其中我的处理是 23 次加入。我有 3 个完整的块和每块 6 个样本。示例数据帧有 4 个响应变量(LH、REN、FTT、DFR)、Accesion(
r - 用于已知命运生存建模的 glmer 的用户定义链接函数
生态学中的一种常见情况是具有二元结果(0 = 死亡，1 = 存活)的生存模型，其中个体(在此示例中考虑鸟类的个体嵌套尝试)在面临死亡风险的天数方面存在差异。为了解决这个问题，我们使用修改后的逻辑回归，
r - 使用泊松误差结构拟合 glmer 时出错
我希望有人能帮助我。我正在尝试进行一项分析，检查在海拔梯度上捕获的膜翅目样本的数量。我想检查与海拔相关的单峰分布以及线性分布的可能性。因此，我将 I(Altitude^2) 作为分析中的解释变量。我
r - 使用效果包循环 glmer 函数时出现意外错误
我正在尝试通过 effect来自 effects 的函数与 (gl)merMod 一起打包来自 lme4 的对象包通过lapply循环并遇到我不期望的错误。看来effect函数无法在循环内查找对象。
r - 逻辑回归 : glmer vs bife
我正在处理面板数据集并尝试运行具有固定效果的逻辑回归。我发现 lme4 包和 bife 包中的 glmer 模型适合这种工作。然而，当我对每个模型进行回归时，我没有得到相同的结果(估计值、标准误差
R:GLMM glmer 与 glmmPQL
glmmPQL 中多重随机效应的语法是什么？使用 glmer 我的代码如下所示: fit<- glmer(A~B+C+ (1 | D)+ (1 | E), family = gaussian, da
r - lme4 glmer 中的缩放预测变量不会解决特征值警告；替代优化也没有
我正在使用 R 中的 lme4 的 glmer 函数分析数据(包括在下面)。我正在构建的模型包含一个泊松分布响应变量 (obs)、一个随机因子 (area)、一个连续偏移量 (duration ),
R:GLMM glmer 与 glmmPQL
glmmPQL 中多重随机效应的语法是什么？使用 glmer 我的代码如下所示: fit<- glmer(A~B+C+ (1 | D)+ (1 | E), family = gaussian, da
r - lme4 glmer 中的缩放预测变量不会解决特征值警告；替代优化也没有
我正在使用 R 中的 lme4 的 glmer 函数分析数据(包括在下面)。我正在构建的模型包含一个泊松分布响应变量 (obs)、一个随机因子 (area)、一个连续偏移量 (duration ),
r - 训练集上的 Predict.glmer 在有或没有新数据的情况下有所不同
这可能更像是一个错误报告而不是一个问题，但是:为什么显式使用 newdata 参数来使用与训练数据相同的数据集进行预测有时会产生与省略不同的预测>newdata 参数并明确使用训练数据集？ libr
r - 如何让 emmeans 打印 glmer 类的自由度
出于报告原因，我试图从 glmer 模型的 emmeans 获取自由度，但它们只显示 Inf。这是一些示例数据。在真实数据中，没有嵌套结构，这只是我构建数据框的结果: set.seed(1234)

首页

博学

6Ren·AI

商城

r - 训练集上的 Predict.glmer 在有或没有新数据的情况下有所不同