gpt4 book ai didi

python - 无法将 r chisquare 拟合优度测试代码转换为等效的 python

转载 作者:太空宇宙 更新时间:2023-11-03 15:42:00 25 4
gpt4 key购买 nike

UCLA 有这个很棒的统计测试网站

https://stats.idre.ucla.edu/r/whatstat/what-statistical-analysis-should-i-usestatistical-analyses-using-r/#1sampt

但代码全部在 R 中。我正在尝试将代码转换为 Python 等价物,但对于像卡方拟合优度这样的人来说,这不是一个简单的过程。这是 R 版本:

hsb2 <- within(read.csv("https://stats.idre.ucla.edu/stat/data/hsb2.csv"), {
race <- as.factor(race)
schtyp <- as.factor(schtyp)
prog <- as.factor(prog)
})
chisq.test(table(hsb2$race), p = c(10, 10, 10, 70)/100)

我的 Python 尝试是这样的:

import numpy as np
import pandas as pd
from scipy import stats

df = pd.read_csv("https://stats.idre.ucla.edu/stat/data/hsb2.csv")
# convert to category
df["race"] = df["race"].astype("category")

t_race = pd.crosstab(df.race, columns = 'race')
p_tests = np.array((10, 10, 10, 70))
p_tests = ptests/100
# tried this
stats.chisquare(t_race, p_tests)
# and this
stats.chisquare(t_race.T, p_tests)

但 stats.chisquare 输出都没有接近 R 版本。任何人都可以引导我朝着正确的方向前进吗?时间差

最佳答案

chisq.test 采用概率向量; stats.chisquare 采用预期的频率 ( docs )。

> results = chisq.test(c(24, 11, 20, 145), p=c(0.1, 0.1, 0.1, 0.7))
> results

Chi-squared test for given probabilities

data: c(24, 11, 20, 145)
X-squared = 5.028571429, df = 3, p-value = 0.169716919

对比

In [49]: obs = np.array([24, 11, 20, 145])

In [50]: prob = np.array([0.1, 0.1, 0.1, 0.7])

In [51]: stats.chisquare(obs, f_exp=obs.sum() * prob)
Out[51]: Power_divergenceResult(statistic=5.0285714285714285, pvalue=0.16971691923343338)

关于python - 无法将 r chisquare 拟合优度测试代码转换为等效的 python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52062030/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com