gpt4 book ai didi

python - 如何优化查看所有记录的 pandas apply lambda?

转载 作者:太空宇宙 更新时间:2023-11-04 10:11:42 26 4
gpt4 key购买 nike

我有一个如下所示的数据框:

ID   YEAR   AMOUNT
1 | 2001 | 4340
1 | 2002 | 5460
1 | 2004 | 1245
1 | 2006 | 6000
2 | 2003 | 5000
2 | 2006 | 3059
....

我想添加一个计算迄今为止最高金额的列,如:

ID   YEAR   AMOUNT  AMT_MAX
1 | 2001 | 4340 | 4340
1 | 2002 | 5460 | 5460
1 | 2004 | 1245 | 5460
1 | 2006 | 6000 | 6000
2 | 2003 | 5000 | 5000
2 | 2006 | 3059 | 3059
....

我写了这个声明来做到这一点:

df['AMT_MAX'] = df.apply(lambda x: 
df[(df.ID == x['ID']) & (df.YEAR <= x['YEAR'])]['AMOUNT'].max(), axis=1 )

但是这很慢。我该如何优化它?

最佳答案

使用cummax

df['AMT_MAX'] = df.groupby('ID').AMOUNT.cummax()

关于python - 如何优化查看所有记录的 pandas apply lambda?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37885882/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com