gpt4 book ai didi

python - 为 python/pandas 中的每一行分配组平均值

转载 作者:太空狗 更新时间:2023-10-30 02:53:31 24 4
gpt4 key购买 nike

我有一个数据框,我希望根据商店和所有商店计算平均值。我创建了代码来计算平均值,但我正在寻找一种更有效的方法。

东风

Cashier#     Store#     Sales    Refunds
001 001 100 1
002 001 150 2
003 001 200 2
004 002 400 1
005 002 600 4

DF-期望

Cashier#     Store#     Sales    Refunds     Sales_StoreAvg    Sales_All_Stores_Avg
001 001 100 1 150 290
002 001 150 2 150 290
003 001 200 2 150 290
004 002 400 1 500 290
005 002 600 4 500 290

我的尝试我创建了两个额外的数据框然后进行了左连接

df.groupby(['Store#']).sum().reset_index().groupby('Sales').mean() 

最佳答案

我认为需要GroupBy.transform对于由具有 mean 的聚合值填充的新列:

df['Sales_StoreAvg'] = df.groupby('Store#')['Sales'].transform('mean')
df['Sales_All_Stores_Avg'] = df['Sales'].mean()
print (df)
Cashier# Store# Sales Refunds Sales_StoreAvg Sales_All_Stores_Avg
0 1 1 100 1 150 290.0
1 2 1 150 2 150 290.0
2 3 1 200 2 150 290.0
3 4 2 400 1 500 290.0
4 5 2 600 4 500 290.0

关于python - 为 python/pandas 中的每一行分配组平均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49281663/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com