- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这可能更像是一个错误报告而不是一个问题,但是:为什么显式使用 newdata
参数来使用与训练数据相同的数据集进行预测有时会产生与省略 不同的预测>newdata
参数并明确使用训练数据集?
library(lme4)
packageVersion("lme4") # 1.1.8
m1 <- glmer(myformula, data=X, family="binomial")
p1 <- predict(m1, type="response")
p2 <- predict(m1, type="response", newdata=X)
all(p1==p2) # FALSE
这不仅仅是一个舍入错误。我看到 cor(p1,p2)
返回 0.8。
这似乎与具有斜坡的模型无关。在下图中,隐式表示预测(..., type="response")
没有新数据,显式表示预测(..., type="response", newdata=X)
,其中 X 与训练相同。模型 1 与其他模型的唯一区别在于模型 1 仅包含(随机)截距,而其他模型具有随机截距和随机斜率。
最佳答案
事实证明,这是 predict.merMod
中的一个错误,已在开发版本中修复(2014 年 11 月,为 this Github issue )。如果您安装了编译工具,您可以直接从 Github 安装开发版本
devtools::install_github("lme4/lme4")
关于r - 训练集上的 Predict.glmer 在有或没有新数据的情况下有所不同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28356192/
我正在使用广义线性混合模型(glmer、lme4-package)用 R 分析我的二项式数据集。我想使用 Tukey 的事后测试(glht,multcomp-package)对某个固定效果(“声音”)
我是 R 新手,我正在使用 glmer 来拟合几个二项式模型,我只需要它们来调用 predict使用得到的概率。但是,我有一个非常大的数据集,即使只有一个模型的大小也会变得非常大: > library
我制作了一个模型,可以查看许多变量以及对怀孕结果的影响。结果是分组的二进制文件。一群动物有 34 只怀孕和 3 只空,接下来会有 20 只怀孕和 4 只空,以此类推。 我使用 glmer 对这些数据进
问题: 我有一个数据集,其中缺少一些预测变量值。我想将已应用于这些插补集的 glmer 模型汇集在一起。我使用 mice 包来创建插补(我也使用过 amelia 和 mi 但没有成功)。我想主要提
我正在测试不同生境和柱头类型的植物柱头上花粉粒数量的差异。 我的样本设计包括两个栖息地,每个栖息地有 10 个站点。 在每个地点,我有多达 3 种柱头类型(湿、干和半干),对于每种柱头类型,我有不同数
我有关于跨纬度感染特定宿主物种的病原体多样性的数据。设计涉及在不同纬度的4个地点的3个地点收集20个人,因此我有20个人,嵌套在3个地点内,嵌套在4个地点内。 鉴于我的病原体多样性数据是带有许多零的计
我一直在用我的(非 r-savvy)大脑来让 R 产生二项式 glmer 模型的正确预测的百分比。我知道这不是统计上的 super 信息,但经常被报道;所以我也想举报。 数据: 因变量:Tipo,它有
我正在使用 glmer 并且我希望提取随机效应(截距和斜率)的方差分量的标准偏差。 我试过使用: VarCorr(model) 它返回两个标准偏差值(加上相关性),但我只想提取截距和斜率 SD 值。
我正在尝试根据我的二项式数据运行的glmer模型随时间(x轴上的天数)预测值。 Total Alive和Total Dead是计数数据。这是我的模型,以及下面的相应步骤。 full.model.dre
我的变量是在一个带有二次抽样设计的随机块上测量的,其中我的处理是 23 次加入。我有 3 个完整的块和每块 6 个样本。示例数据帧有 4 个响应变量(LH、REN、FTT、DFR)、Accesion(
生态学中的一种常见情况是具有二元结果(0 = 死亡,1 = 存活)的生存模型,其中个体(在此示例中考虑鸟类的个体嵌套尝试)在面临死亡风险的天数方面存在差异。为了解决这个问题,我们使用修改后的逻辑回归,
我希望有人能帮助我。我正在尝试进行一项分析,检查在海拔梯度上捕获的膜翅目样本的数量。我想检查与海拔相关的单峰分布以及线性分布的可能性。因此,我将 I(Altitude^2) 作为分析中的解释变量。 我
我正在尝试通过 effect来自 effects 的函数与 (gl)merMod 一起打包来自 lme4 的对象包通过lapply循环并遇到我不期望的错误。看来effect函数无法在循环内查找对象。
我正在处理面板数据集并尝试运行具有固定效果的逻辑回归。 我发现 lme4 包和 bife 包中的 glmer 模型适合这种工作。 然而,当我对每个模型进行回归时,我没有得到相同的结果(估计值、标准误差
glmmPQL 中多重随机效应的语法是什么? 使用 glmer 我的代码如下所示: fit<- glmer(A~B+C+ (1 | D)+ (1 | E), family = gaussian, da
我正在使用 R 中的 lme4 的 glmer 函数分析数据(包括在下面)。我正在构建的模型包含一个泊松分布响应变量 (obs)、一个随机因子 (area)、一个连续偏移量 (duration ),
glmmPQL 中多重随机效应的语法是什么? 使用 glmer 我的代码如下所示: fit<- glmer(A~B+C+ (1 | D)+ (1 | E), family = gaussian, da
我正在使用 R 中的 lme4 的 glmer 函数分析数据(包括在下面)。我正在构建的模型包含一个泊松分布响应变量 (obs)、一个随机因子 (area)、一个连续偏移量 (duration ),
这可能更像是一个错误报告而不是一个问题,但是:为什么显式使用 newdata 参数来使用与训练数据相同的数据集进行预测有时会产生与省略 不同的预测>newdata 参数并明确使用训练数据集? libr
出于报告原因,我试图从 glmer 模型的 emmeans 获取自由度,但它们只显示 Inf。 这是一些示例数据。在真实数据中,没有嵌套结构,这只是我构建数据框的结果: set.seed(1234)
我是一名优秀的程序员,十分优秀!