gpt4 book ai didi

python - 从 numpy 数组中删除 pandas 中的特定行

转载 作者:行者123 更新时间:2023-12-01 01:20:28 24 4
gpt4 key购买 nike

我有一个数千行长的数据框,如下所示:

ID  Email Address
1 ... ...
2 ... ...
3 ... ...
4 ... ...
1 ... ...
2 ... ...
5 ... ...
5 ... ...
6 ... ...

我想要做的是删除重复的 ID,这样每个人只有一个 ID。我不能使用 drop_duplicates() 因为大多数人没有 ID,这也会删除它们(不好!)

是否有一种方法可以删除特定行并仅保留 ID 的一个实例。

我有一个包含所有重复 ID 的数据框,如果有帮助的话,我想删除它。例如对于我上面给出的例子:

ID  Email  Address
1 ... ...
2 ... ...
5 ... ...

也许有一种方法可以将其转换为一系列 ID/数组并以这种方式从 df 中删除?

最佳答案

我相信你需要链2个条件 - duplicated对于所有欺骗,使用 keep=False 对于第一个欺骗没有参数:

df = df[df.duplicated(subset='ID', keep=False) & df.duplicated(subset='ID')]
print (df)
ID Email Address
4 1 ... ...
5 2 ... ...
7 5 ... ...

关于python - 从 numpy 数组中删除 pandas 中的特定行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53884070/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com