gpt4 book ai didi

python - 计算列中的重复项并将它们添加到新列 Pandas

转载 作者:行者123 更新时间:2023-12-05 00:54:31 25 4
gpt4 key购买 nike

我试图计算重复次数,然后 drop.cuplicates 以获取没有重复项的数据帧,但有额外的 col,其中我们有代表有多少重复项的数字

来自

       id  letter
0 665639 AAAAAA
1 665639 AAAAAA
2 665639 AAAAAA
3 665639 AAAAAA
5 702090 BBBBBB
6 702092 CCCCCC

       id  letter   count
0 665639 AAAAAA 4
1 665639 AAAAAA 4
2 665639 AAAAAA 4
3 665639 AAAAAA 4
5 702090 BBBBBB 1
6 702092 CCCCCC 1

及之后

df.drop.duplicates(subset=['id'] ,inplace=True)

       id  letter   count
0 665639 AAAAAA 4
5 702090 BBBBBB 1
6 702092 CCCCCC 1

我的方法是:

cols = ['id','letter']
df['count'] = df.groupby(cols)['id'].transform('size')

但是当我这样做时,我得到的数据帧只有 1 个计数

最佳答案

我将首先创建重复计数

df['Count'] = 1
df.groupby(['id','letter']).Count.count().reset_index()

然后删除重复项

df.drop_duplicates()

关于python - 计算列中的重复项并将它们添加到新列 Pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66109092/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com