gpt4 book ai didi

r - 用 R 中的 anova() 比较两个线性模型

转载 作者:行者123 更新时间:2023-12-04 12:20:54 25 4
gpt4 key购买 nike

关闭。这个问题是off-topic .它目前不接受答案。












想改善这个问题吗? Update the question所以它是 on-topic对于堆栈溢出。

8年前关闭。




Improve this question




我不太明白这个输出中的 p 值是什么意思。我不是指 p 值本身,但在这种情况下。

> Model 1: sl ~ le + ky 
> Model 2: sl ~ le
Res.Df RSS Df Sum of Sq F Pr(>F)
1 97 0.51113
2 98 0.51211 -1 -0.00097796 0.1856 0.6676

我得到了类似的东西,现在我想知道哪种模型更合适。
因为只有一个而不是两个 p 值,所以我很困惑。
我使用 summary(model1) 或 summary(model2) 得到不同的 pvalues

现在如果
> fm2<-lm(Y~X+T)

(T 是我的指标变量)和
> fm4<-lm(Y~X)

如果我做
> anova(fm2,fm4)

这将检验零假设 H0: alpha1==alpha2 (Ha: alpha1!=alpha2) c(阿尔法是我的拦截)
所以测试是有一个拦截(=> alpha1==alpha2),还是两个拦截( alpha1!=alpha2 )更好

在这种情况下,我们现在显然会拒绝原假设,因为 p 值为 0.6676。

这意味着我们应该坚持使用模型 fm4 ,因为它更适合我们的数据。

我得出的结论对吗?我尽了最大努力,但我不确定 p 值的含义。因为只有 on,这就是我认为的意思。
有人可以清理一下吗?

最佳答案

您的意思是“ 不是 显然拒绝零假设”(而不是“现在明显拒绝”)?考虑到您的其余问题,这似乎更有意义。

只有一个 p 值,因为有两个模型要比较,因此只有一个比较(零假设与替代方案,或者在这种情况下实际上是零假设与未指定的替代方案)。从你上面所说的听起来好像le是连续的且 ky是分类预测器,在这种情况下,您将具有斜率和截距的模型与(如您所说)具有单个斜率和两个截距的模型进行比较。由于 p 值相对较大,这意味着数据没有提供 ky 的加性效应的证据。 .更简单的模型通常更合适(尽管要小心这个结论,因为构建 p 值是为了检验假设,而不是在模型中进行选择)。

您为 summary() 获得的 p 值每个单独模型的 p 值是每个模型中每个参数的影响的 p 值,条件是该模型中的所有其他参数。如果您的数据完全平衡(这在回归设计中不太可能),您应该从 summary 得到相同的答案。和 anova , 否则来自 anova 的结果通常是优选的。

这个问题可能更适合http://stats.stackexchange.com ,因为它实际上是关于统计解释而不是编程......

关于r - 用 R 中的 anova() 比较两个线性模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12863178/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com