gpt4 book ai didi

python - 使用 pandas GroupBy.agg() 对同一列进行多次聚合

转载 作者:太空宇宙 更新时间:2023-11-03 20:44:27 25 4
gpt4 key购买 nike

是否有 pandas 内置方法可以将两个不同的聚合函数 f1, f2 应用于同一列 df["returns"],而无需调用 agg() 多次?

示例数据框:

import pandas as pd
import datetime as dt
import numpy as np

pd.np.random.seed(0)
df = pd.DataFrame({
"date" : [dt.date(2012, x, 1) for x in range(1, 11)],
"returns" : 0.05 * np.random.randn(10),
"dummy" : np.repeat(1, 10)
})

语法上错误但直观上正确的方法是:

# Assume `f1` and `f2` are defined for aggregating.
df.groupby("dummy").agg({"returns": f1, "returns": f2})

显然,Python 不允许重复的键。是否有其他方式来表达agg()的输入?也许元组列表 [(column, function)] 会更好,以允许将多个函数应用于同一列?但是 agg() 似乎只接受字典。

除了定义一个仅应用其中两个函数的辅助函数之外,是否有解决方法? (无论如何,这如何与聚合一起使用?)

最佳答案

截至 2022 年 6 月 20 日,以下是公认的聚合做法:

df.groupby('dummy').agg(
Mean=('returns', np.mean),
Sum=('returns', np.sum))

参见this answer了解更多信息。

<小时/>

以下包含 pandas 历史版本的首屏。

您可以简单地将函数作为列表传递:

In [20]: df.groupby("dummy").agg({"returns": [np.mean, np.sum]})
Out[20]:
mean sum
dummy
1 0.036901 0.369012

或者作为字典:

In [21]: df.groupby('dummy').agg({'returns':
{'Mean': np.mean, 'Sum': np.sum}})
Out[21]:
returns
Mean Sum
dummy
1 0.036901 0.369012

关于python - 使用 pandas GroupBy.agg() 对同一列进行多次聚合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56690343/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com