gpt4 book ai didi

python - 如何创建汇总统计的数据框?

转载 作者:太空宇宙 更新时间:2023-11-03 11:02:04 25 4
gpt4 key购买 nike

我有一个包含 ID 的数据框以及与每个 ID 相关的大量测试结果。我想要做的是创建第二个数据框,它总结了特定测试的平均分数和标准偏差,然后我可以将其绘制在图表上。

下面是我目前的代码。它返回错误“ValueError:长度不匹配:预期轴有 1 个元素,新值有 2 个元素”。

有人能帮忙吗?


    df2 = df1.groupby(['id'], as_index=True).agg({'variable_1':['mean'], 'variable_1':['std']})
df2.columns=['var_mean','var_std']
df2.plot(x='var_mean', y='var_std', kind='scatter', figsize=(15,10), title='Standard Deviation of Std vs Mean')


example data:

ID Variable_1
1234 32
1234 23
2345 54
2345 65
2345 76
3456 78

what I'd like:

ID Mean SD
1234 23.5 2.2
2345 45 9
...
...

最佳答案

您可以将函数字典传递给 groupby 以使用 agg 执行统计:

In [154]:

df.groupby('ID')['Variable_1'].agg({'Mean':np.mean, 'SD':np.std})
Out[154]:
Mean SD
ID
1234 27.5 6.363961
2345 65.0 11.000000
3456 78.0 NaN

关于python - 如何创建汇总统计的数据框?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30328776/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com