gpt4 book ai didi

r - R 是否错误地计算了具有低单元格计数的 2x2 表的卡方统计量?

转载 作者:行者123 更新时间:2023-12-04 09:33:36 25 4
gpt4 key购买 nike

我刚刚注意到,对于单元格频率较低的 2 x 2 表格,即使进行了 Yates 校正,R似乎计算 chi^2 统计数据不正确。

mat <- matrix(c(3, 2, 14, 10), ncol = 2)
chi <- stats::chisq.test(mat)
## Warning message:
## In stats::chisq.test(mat) : Chi-squared approximation may be incorrect

# from the function
chi$statistic
## X-squared
## 1.626059e-31

# as it should be (with Yates correction)
sum((abs(chi$observed - chi$expected) - 0.5)^2 / chi$expected)
## [1] 0.1851001

我认为 R 是否正确?是不是计算错误,而第二种方法产生的 0.185 更准确?还是小细胞计数意味着所有赌注都已关闭?

更新:

如果没有 Yates 连续性校正,它似乎工作正常:
chi <- stats::chisq.test(mat, correct = FALSE)
## Warning message:
## In stats::chisq.test(mat, correct = FALSE) :
## Chi-squared approximation may be incorrect

chi$statistic
## X-squared
## 0.004738562

sum((abs(chi$observed - chi$expected))^2 / chi$expected)
## [1] 0.004738562

最佳答案

帮助文件/手册页说明

one half is subtracted from all |O - E| differences; however,
the correction will not be bigger than the differences themselves.

您示例中的差异都小于 0.5:
> chi$observed - chi$expected
[,1] [,2]
[1,] 0.06896552 -0.06896552
[2,] -0.06896552 0.06896552

因此,至少,它似乎是记录在案的行为。

旁注:如果有疑问,您显然可以使用模拟找到的 p 值
> chi <- stats::chisq.test(mat, simulate.p.value=TRUE, B=1e6)
> chi

Pearson's Chi-squared test with simulated p-value (based on 1e+06 replicates)

data: mat
X-squared = 0.0047386, df = NA, p-value = 1

在这种情况下,它会在中间的某个地方找到一个卡方并消除警告。或使用 fisher.test ...

关于r - R 是否错误地计算了具有低单元格计数的 2x2 表的卡方统计量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41780926/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com