gpt4 book ai didi

python - 计算pandas DataFrame中每组的t检验统计量

转载 作者:行者123 更新时间:2023-12-04 01:59:26 26 4
gpt4 key购买 nike

给定一个 pandas DataFrame带有 group 的列, x , 和 y (每个 group 值有多个记录),我想创建一个新的 DataFrame每排一行 group以及 x 的相关 t 统计量和 y该组中的值。我想用 groupby 来做这件事,不是循环。

例子:

import pandas as pd
import numpy as np
from scipy import stats

N = 100 # Observations per group.
tt_df = pd.DataFrame({'group': np.append(['A'] * N, ['B'] * N),
'x': np.random.randn(2 * N)})
tt_df['y'] = tt_df['x'] + np.random.randn(2 * N)
stats.ttest_ind(tt_df['x'], tt_df['y'])[0] # -0.32 global t statistic.

最佳答案

tt_df.groupby('group').apply(lambda df: stats.ttest_ind(df['x'], df['y'])[0])
# group
# A -0.292413
# B -0.167816
# dtype: float64

关于python - 计算pandas DataFrame中每组的t检验统计量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48434391/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com