gpt4 book ai didi

python - 我使用什么 scipy 统计测试来比较样本均值?

转载 作者:太空狗 更新时间:2023-10-29 20:25:36 25 4
gpt4 key购买 nike

假设样本量不相等,在以下情况下我用什么检验来比较样本均值(如果以下任何一项不正确,请更正):

正态分布 = True方差同质性 = True

scipy.stats.ttest_ind(sample_1, sample_2)

正态分布 = True方差同质性 = False

scipy.stats.ttest_ind(sample_1, sample_2, equal_var = False)

正态分布 = 假方差同质性 = 真

scipy.stats.mannwhitneyu(sample_1, sample_2)

正态分布 = 假方差同质性 = 假

???

最佳答案

快速回答:

正态分布 = True方差同质性 = False样本量 > 30-50

scipy.stats.ttest_ind(sample1, sample2, equal_var=False)

好的答案:

如果您查看中心极限定理,它会说(来自维基百科):“在概率论中,中心极限定理 (CLT) 表明,在给定特定条件的情况下,足够多的独立随机迭代的算术平均值每个变量都具有明确定义的(有限)期望值和有限方差,将近似正态分布,而不管基础分布如何”

因此,尽管您没有正态分布的总体,但如果您的样本足够大(大于 30 或 50 个样本),则样本的均值将服从正态分布。所以,你可以使用:

scipy.stats.ttest_ind(sample1, sample2, equal_var=False)

这是对原假设的双侧检验,即 2 个独立样本具有相同的平均值(预期)值。通过选项 equal_var = False,它执行 Welch 的 t 检验,该检验不假设总体方差相等。

关于python - 我使用什么 scipy 统计测试来比较样本均值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25064506/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com