- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在计算一个小型并发表的 chi2 检验统计量:
obs = np.array([
[652, 576],
[1348, 924]
])
当我手工计算时,如图 Wikipedia 所示(Σ (Oᵢ - Eᵢ)²/Eᵢ) 我得到的结果是 ~12.660,但是 scipy.stats.chi2_contingency
函数返回这些结果和另一个测试统计数据:
>>> scipy.stats.chi2_contingency(obs)
(12.40676502094132, 0.00042778128638335943, 1, array([[ 701.71428571, 526.28571429],
[ 1298.28571429, 973.71428571]]))
我将结果的预期频率与我的进行了比较,结果发现它们是相同的。此外,通过将我的数据输入在线计算器,可以得到与我自己相同的结果(例如 http://www.socscistatistics.com/tests/chisquare2/default2.aspx )。
这个函数有什么魔力可以减少测试统计量?
最佳答案
默认情况下,correction
为 True
,这意味着 Yates 的连续性校正适用于自由度为 1 的情况(如此处所示)。如果您设置 correction=False
这不会发生,您将得到 12.660... 作为测试统计数据:
>>> scipy.stats.chi2_contingency(obs, correction=False)
(12.660142450795965,
0.00037353375362753034,
1,
array([[ 701.71428571, 526.28571429],
[ 1298.28571429, 973.71428571]])
documentation为 correction
参数提供了以下更多信息并总结了 Yates 的更正:
If True, and the degrees of freedom is 1, apply Yates’ correction for continuity. The effect of the correction is to adjust each observed value by 0.5 towards the corresponding expected value.
关于python - 为什么 scipy 中的 χ² 检验会返回较小的检验统计量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34975115/
这是我第一次提问,对于任何格式问题或任何让我难以回答的问题,我深表歉意。请让我知道我需要添加什么才能回答问题。 我正在尝试比较 2 个不相等的组大小(一个 ~ 97,另一个 ~ 714)之间的差异。差
这个问题在这里已经有了答案: dplyr summarize across ttest (1 个回答) 关闭 5 个月前。 我有这样的数据框 X1 X2 X3 X4 X5 class 1 1
我正在尝试对数据框中的两个数据子集运行 wilcox.test()。它们的长度不相等(48 对 260)。我想看看活橡树和水橡树的 dbh(胸高直径)是否存在差异。 Pine_stand 并收到该错
我有一个带有两个级别的因子列和许多数字列的数据框。我想按因子列拆分数据帧并对列对进行 t 检验。 使用示例数据集 Puromycin 我希望结果看起来像这样: Variable Treated
我尝试对数据框的所有列(一次两列)进行 t 检验,并仅提取 p 值。这是我想出的: for (i in c(5:525) ) { t_test_p.value =sapply( Data[5:525]
我有一个有 11 列数据的 Pandas 。我想通过测试将每一列与其他每一列进行比较(见下文)。如何创建一个循环来自动比较所有列,而无需为每个列对组合手动编写代码? from scipy.stats
我有一些数据,如下所示: # Groups: date [4] date data 1 2021-01-31 2 20
这就是我的数据的样子: > dput(data) structure(list(Name = c("Mark", "Tere", "Marcus", "Heidi", "Georg", "Tieme"
我有一个有 11 列数据的 Pandas 。我想通过测试将每一列与其他每一列进行比较(见下文)。如何创建一个循环来自动比较所有列,而无需为每个列对组合手动编写代码? from scipy.stats
我有一些数据,如下所示: # Groups: date [4] date data 1 2021-01-31 2 20
所以我有一些股票价格数据,我想测试价格是否遵循对数正态分布。我的代码如下: import scipy.stats as stats print(stats.kstest(df['DJIA'], "lo
我想对我的固定效应回归系数进行简单的联合 Wald 检验,但我想将限制设置为非零值。更具体地说,我想测试:H0: ai=0 and b=1 for every i或者基本上,是否从固定效应模型 (ai
我正在尝试进行双样本 t 检验,以检查两个数据集之间的均值是否存在显着差异。 我有两个数据集,每个数据集有 5 个试验,每个试验有 3 个特征。每个 Trial 都有不同的唯一标签,但 3 个特征(X
考虑以下虚拟数据: x <- rnorm(15,mean = 3,sd = 1) y <- rnorm(15,mean = 3,sd = 1) xy <- c(x,y) factor <- c(rep
我是一名计算机科学专业的学生,我正在自学算法类(class)。 在类(class)中我看到了这个问题: Show an efficient randomized algorithm to fact
我想使用拟合我的数据的 f 检验来比较两个模型。对于每个模型,我都执行了蒙特卡洛模拟,为每个模型参数和均方根拟合误差提供了统计估计。我想在 R 中使用 f-test 来确定哪个模型更可取。 最佳答案
我很难让 ks.test 使用卡方分布式数据: > chi10 ks.test(chi10, dchisq, df=10) One-sample Kolmogorov-Smirnov tes
我试图在 R 中复制 SPSS 的线性判别分析输出,但我很难找到执行 m-box 测试的方法。 我唯一找到的是一些发布在论坛上的代码,用于手动实现该过程,但我想知道语言本身是否已经包含用于此目的的任何
我有以下数据框: structure(list(test1 = c(0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1), test2 = c(0, 0, 1, 1, 0,
标准 stats::kruskal.test 模块允许计算数据集上的 kruskal-wallis 测试: >>> data(diamonds) >>> kruskal.test(price~cara
我是一名优秀的程序员,十分优秀!