gpt4 book ai didi

r - 相同的回归,不同的统计数据(R v. SAS)?

转载 作者:行者123 更新时间:2023-12-04 10:36:46 26 4
gpt4 key购买 nike

我在 SAS 和 R 中运行了相同的概率回归,虽然我的系数估计(基本上)是等效的,但报告的测试统计数据是不同的。具体来说,SAS 将检验统计量报告为 t 统计量,而 R 将检验统计量报告为 z 统计量。

我检查了我的计量经济学文本,发现(几乎没有详细说明)它报告了 t 统计量的概率结果。

哪个统计量合适?为什么 R 与 SAS 不同?

这是我的 SAS 代码:

proc qlim data=DavesData;
model y = x1 x2 x3/ discrete(d=probit);
run;
quit;

这是我的 R 代码:
> model.1 <- glm(y ~ x1 + x2 + x3, family=binomial(link="probit"))
> summary(model.1)

最佳答案

只是回答一点 - 这严重偏离主题,实际上应该关闭问题 - 但 t 统计量和 z 统计量都没有意义。不过,它们都是相关的,因为 Z 只是标准正态分布,而 T 是经过调整的“接近正态”分布,它考虑到您的样本仅限于 n 个案例这一事实。

现在,z 和 t 统计量都提供了各自系数为零的原假设的显着性。用于该测试的系数的标准误差基于残差。使用链接函数,您实际上以残差再次变为正态的方式转换您的响应,而实际上残差代表观察到的和估计的比例之间的差异。由于这种转换,T 统计量的自由度计算不再有用,因此 R 假定检验统计量的标准正态分布。

两个结果完全相同,R 只会给出稍微尖锐的 p 值。这是一个有争议的问题,但如果您查看比例差异检验,它们也总是使用标准正态近似(Z 检验)完成。

这让我回到了这样一个观点,即这些值实际上都没有任何意义。如果您想知道一个变量是否对 p 值有显着贡献,实际上可以说明某些事情,您可以使用卡方检验,如似然比检验 (LR)、分数检验或 Wald 检验。 R 只是给你标准似然比,SAS 也给你另外两个。但是这三个测试本质上是等效的,如果它们严重不同,那么是时候再次查看您的数据了。

例如在 R 中:

anova(model.1,test="Chisq")

对于 SAS:参见示例 here使用对比,获得 LR、Score 或 Wald 测试

关于r - 相同的回归,不同的统计数据(R v. SAS)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3721431/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com