gpt4 book ai didi

python - 使用多列的 Pandas DataFrame 聚合函数

转载 作者:IT老高 更新时间:2023-10-28 21:43:40 25 4
gpt4 key购买 nike

有没有一种方法可以编写一个在 DataFrame.agg 方法中使用的聚合函数,它可以访问多个正在聚合的数据列?典型的用例是加权平均、加权标准差函数。

我希望能够写出类似的东西

def wAvg(c, w):
return ((c * w).sum() / w.sum())

df = DataFrame(....) # df has columns c and w, i want weighted average
# of c using w as weight.
df.aggregate ({"c": wAvg}) # and somehow tell it to use w column as weights ...

最佳答案

是的;使用 .apply(...) 函数,该函数将在每个子 DataFrame 上调用。例如:

grouped = df.groupby(keys)

def wavg(group):
d = group['data']
w = group['weights']
return (d * w).sum() / w.sum()

grouped.apply(wavg)

关于python - 使用多列的 Pandas DataFrame 聚合函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10951341/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com