gpt4 book ai didi

python - 使用 Pandas 标记每组的第 N 行

转载 作者:行者123 更新时间:2023-11-28 20:57:03 24 4
gpt4 key购买 nike

我有一个包含客户信息及其购买详细信息的 Dataframe。我正在尝试添加一个新列,以指示同一客户完成的每 3 次购买。

下面是Dataframe

customer_name,bill_no,date
Mark,101,2018-10-01
Scott,102,2018-10-01
Pete,103,2018-10-02
Mark,104,2018-10-02
Mark,105,2018-10-04
Scott,106,2018-10-21
Julie,107,2018-10-03
Kevin,108,2018-10-07
Steve,109,2018-10-02
Mark,110,2018-10-06
Mark,111,2018-10-02
Mark,112,2018-10-05
Mark,113,2018-10-05

我写信是为了过滤同一客户完成的每 3 次购买。所以在这种情况下,我想为下面的 bill_no 添加一个标志

Mark,105,2018-10-04
Mark,112,2018-10-05

基本上是为同一客户生成 3 的倍数账单。

最佳答案

使用 groupby.cumcount :

n = 3
df['flag'] = df.groupby('customer_name').cumcount() + 1
df['flag'] = ((df['flag'] % n) == 0).astype(int)

print(df)
customer_name bill_no date flag
0 Mark 101 2018-10-01 0
1 Scott 102 2018-10-01 0
2 Pete 103 2018-10-02 0
3 Mark 104 2018-10-02 0
4 Mark 105 2018-10-04 1
5 Scott 106 2018-10-21 0
6 Julie 107 2018-10-03 0
7 Kevin 108 2018-10-07 0
8 Steve 109 2018-10-02 0
9 Mark 110 2018-10-06 0
10 Mark 111 2018-10-02 0
11 Mark 112 2018-10-05 1
12 Mark 113 2018-10-05 0

关于python - 使用 Pandas 标记每组的第 N 行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53813918/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com