gpt4 book ai didi

python - 重复信息

转载 作者:行者123 更新时间:2023-12-01 09:15:48 27 4
gpt4 key购买 nike

我有一个包含列 [CPF、姓名、年龄] 的 df。我需要找到基地重复的CPF,并将该人的姓名与CPF一起返回。到目前为止我已经做到了。

    TrueDuplicat = base.groupby(['CPF']).size().reset_index(name='count')
TrueDuplicat = TrueDuplicat[TrueDuplicat['count']>1]

当我输入时:

    TrueDuplicat = TrueDuplicat[['name','CPF']]

我收到错误“['name'] 不在索引中”。

如何获得带有此人姓名的 CPF 副本?

DF 示例

CPF         name  age

38445675455 Alex 15

54785698574 Ana 25

38445675455 Bento 22

65878584558 Caio 33

最佳答案

groupby 之后,TrueDuplicat 中没有 name 列。对于您发布的示例,TrueDuplicat 是:

           CPF  count
0 38445675455 2

如果您要在 TrueDuplicat 中查找与 CPF 值相对应的名称,您可以执行类似的操作

df[df['CPF'].isin(TrueDuplicat['CPF'].tolist())]

对于您的示例,这将产生

           CPF   name  age
0 38445675455 Alex 15
2 38445675455 Bento 22

关于python - 重复信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51266778/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com