python - 执行 2 个样本 t 检验-6ren

python - 执行 2 个样本 t 检验

转载作者：IT老高更新时间：2023-10-28 20:43:03

25

4

我有样本 1 和样本 2 的平均值、标准差和 n - 样本取自样本总体，但由不同的实验室测量。

样本 1 和样本 2 的 n 不同。我想做一个加权(考虑 n)双尾 t 检验。

我尝试使用 scipy.stat模块通过使用 np.random.normal 创建我的数字，因为它只需要数据而不是像 mean 和 std dev 这样的统计值(有什么方法可以直接使用这些值)。但它不起作用，因为数据数组必须具有相同的大小。

任何有关如何获得 p 值的帮助将不胜感激。

最佳答案

如果你有数组a和b的原始数据，你可以使用scipy.stats.ttest_ind使用参数 equal_var=False:

t, p = ttest_ind(a, b, equal_var=False)

如果你只有两个数据集的汇总统计，可以使用scipy.stats.ttest_ind_from_stats计算t值(在 0.16 版中添加到 scipy)或来自公式( http://en.wikipedia.org/wiki/Welch%27s_t_test )。

以下脚本显示了可能性。

from __future__ import print_function

import numpy as np
from scipy.stats import ttest_ind, ttest_ind_from_stats
from scipy.special import stdtr

np.random.seed(1)

# Create sample data.
a = np.random.randn(40)
b = 4*np.random.randn(50)

# Use scipy.stats.ttest_ind.
t, p = ttest_ind(a, b, equal_var=False)
print("ttest_ind:            t = %g  p = %g" % (t, p))

# Compute the descriptive statistics of a and b.
abar = a.mean()
avar = a.var(ddof=1)
na = a.size
adof = na - 1

bbar = b.mean()
bvar = b.var(ddof=1)
nb = b.size
bdof = nb - 1

# Use scipy.stats.ttest_ind_from_stats.
t2, p2 = ttest_ind_from_stats(abar, np.sqrt(avar), na,
                              bbar, np.sqrt(bvar), nb,
                              equal_var=False)
print("ttest_ind_from_stats: t = %g  p = %g" % (t2, p2))

# Use the formulas directly.
tf = (abar - bbar) / np.sqrt(avar/na + bvar/nb)
dof = (avar/na + bvar/nb)**2 / (avar**2/(na**2*adof) + bvar**2/(nb**2*bdof))
pf = 2*stdtr(dof, -np.abs(tf))

print("formula:              t = %g  p = %g" % (tf, pf))

输出:

ttest_ind:            t = -1.5827  p = 0.118873
ttest_ind_from_stats: t = -1.5827  p = 0.118873
formula:              t = -1.5827  p = 0.118873

关于python - 执行 2 个样本 t 检验，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/22611446/

25

4

0

文章推荐： java - 二分查找中的第一次出现

文章推荐： java - 级联示例编译失败？

文章推荐： java - JMeter 延迟与加载时间(采样时间)

文章推荐： java - PDF找出文本是否带下划线或表格单元格

稳健的独立 T 检验
这是我第一次提问，对于任何格式问题或任何让我难以回答的问题，我深表歉意。请让我知道我需要添加什么才能回答问题。我正在尝试比较 2 个不相等的组大小(一个 ~ 97，另一个 ~ 714)之间的差异。差
r - 对由变量分隔的数据框的所有列应用 t 检验
这个问题在这里已经有了答案: dplyr summarize across ttest (1 个回答) 关闭 5 个月前。我有这样的数据框 X1 X2 X3 X4 X5 class 1 1
r - 有没有办法对不同长度的变量进行 wilcoxon 检验？
我正在尝试对数据框中的两个数据子集运行 wilcox.test()。它们的长度不相等(48 对 260)。我想看看活橡树和水橡树的 dbh(胸高直径)是否存在差异。 Pine_stand 并收到该错
r - 对按因子拆分的数据帧中的许多列应用 t 检验
我有一个带有两个级别的因子列和许多数字列的数据框。我想按因子列拆分数据帧并对列对进行 t 检验。使用示例数据集 Puromycin 我希望结果看起来像这样: Variable Treated
R:对所有列进行 t 检验
我尝试对数据框的所有列(一次两列)进行 t 检验，并仅提取 p 值。这是我想出的: for (i in c(5:525) ) { t_test_p.value =sapply( Data[5:525]
python - 用于比较多个数据列的循环 T 检验
我有一个有 11 列数据的 Pandas 。我想通过测试将每一列与其他每一列进行比较(见下文)。如何创建一个循环来自动比较所有列，而无需为每个列对组合手动编写代码？ from scipy.stats
r - 映射嵌套列并计算两组之间的 t 检验
我有一些数据，如下所示: # Groups: date [4] date data 1 2021-01-31 2 20
r - 同一数据集中定义行之间的 T 检验
这就是我的数据的样子: > dput(data) structure(list(Name = c("Mark", "Tere", "Marcus", "Heidi", "Georg", "Tieme"
python - 用于比较多个数据列的循环 T 检验
我有一个有 11 列数据的 Pandas 。我想通过测试将每一列与其他每一列进行比较(见下文)。如何创建一个循环来自动比较所有列，而无需为每个列对组合手动编写代码？ from scipy.stats
r - 映射嵌套列并计算两组之间的 t 检验
我有一些数据，如下所示: # Groups: date [4] date data 1 2021-01-31 2 20
python - 实现对数正态拟合的 KS 检验
所以我有一些股票价格数据，我想测试价格是否遵循对数正态分布。我的代码如下: import scipy.stats as stats print(stats.kstest(df['DJIA'], "lo
r - 如何针对某些特定值对面板数据回归系数执行联合 Wald 检验？
我想对我的固定效应回归系数进行简单的联合 Wald 检验，但我想将限制设置为非零值。更具体地说，我想测试:H0: ai=0 and b=1 for every i或者基本上，是否从固定效应模型 (ai
python - Python 中每一行的两个样本 t 检验
我正在尝试进行双样本 t 检验，以检查两个数据集之间的均值是否存在显着差异。我有两个数据集，每个数据集有 5 个试验，每个试验有 3 个特征。每个 Trial 都有不同的唯一标签，但 3 个特征(X
r - R 中的折刀配对 t 检验
考虑以下虚拟数据: x <- rnorm(15,mean = 3,sd = 1) y <- rnorm(15,mean = 3,sd = 1) xy <- c(x,y) factor <- c(rep
algorithm - 卡迈克尔数的 Rabin-Miller 检验
我是一名计算机科学专业的学生，我正在自学算法类(class)。在类(class)中我看到了这个问题: Show an efficient randomized algorithm to fact
r - R 中两个模型的 f 检验
我想使用拟合我的数据的 f 检验来比较两个模型。对于每个模型，我都执行了蒙特卡洛模拟，为每个模型参数和均方根拟合误差提供了统计估计。我想在 R 中使用 f-test 来确定哪个模型更可取。最佳答案
r - 使用卡方数据的 Kolmogorov-Smirnov 检验
我很难让 ks.test 使用卡方分布式数据: > chi10 ks.test(chi10, dchisq, df=10) One-sample Kolmogorov-Smirnov tes
R Box 的同方差性 M 检验
我试图在 R 中复制 SPSS 的线性判别分析输出，但我很难找到执行 m-box 测试的方法。我唯一找到的是一些发布在论坛上的代码，用于手动实现该过程，但我想知道语言本身是否已经包含用于此目的的任何
R:在所有可能的变量组合之间执行 Cohen's Kappa 检验
我有以下数据框: structure(list(test1 = c(0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1), test2 = c(0, 0, 1, 1, 0,
r - Kruskal-Wallis 检验，包含成对比较的详细信息
标准 stats::kruskal.test 模块允许计算数据集上的 kruskal-wallis 测试: >>> data(diamonds) >>> kruskal.test(price~cara

首页

博学

6Ren·AI

商城

python - 执行 2 个样本 t 检验