gpt4 book ai didi

python - 如何在 pandas 数据框中执行不同值的累积和

转载 作者:行者123 更新时间:2023-12-02 07:09:54 25 4
gpt4 key购买 nike

我有一个像这样的数据框:

id    date         company    ......
123 2019-01-01 A
224 2019-01-01 B
345 2019-01-01 B
987 2019-01-03 C
334 2019-01-03 C
908 2019-01-04 C
765 2019-01-04 A
554 2019-01-05 A
482 2019-01-05 D

我想获取“公司”列随着时间的推移唯一值的累积数量。因此,如果一家公司稍后出现,则不会再次计算在内。

我的预期输出是:

date            cumulative_count
2019-01-01 2
2019-01-03 3
2019-01-04 3
2019-01-05 4

我已经尝试过:

df.groupby(['date']).company.nunique().cumsum()

但如果同一家公司出现在不同的日期,则重复计数。

最佳答案

使用重复 + cumsum + 最后

m = df.duplicated('company')
d = df['date']

(~m).cumsum().groupby(d).last()

date
2019-01-01 2
2019-01-03 3
2019-01-04 3
2019-01-05 4
dtype: int32

关于python - 如何在 pandas 数据框中执行不同值的累积和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57807505/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com