gpt4 book ai didi

python - 基于三列的重复项

转载 作者:行者123 更新时间:2023-12-01 09:34:11 25 4
gpt4 key购买 nike

所以我有一个包含列的数据集

Date, Name, Type, .... 

我正在尝试找到一种方法来获取所有三个合并为索引的重复项,但它似乎不起作用。我尝试设置索引,然后尝试获取重复项,但它似乎没有正确地返回给我。

我做到了:

pc = pc.set_index(['name', 'date', 'type']).sort_index()
pc[pc.index.duplicated()]

但这似乎带来的返回比我预期的要多得多。

最佳答案

为此使用参数keep=False:

pc = pd.DataFrame([[0, 1, 2, 3, 4],
[0, 1, 2, 4, 5],
[0, 2, 3, 5, 6]],
columns=['name', 'date', 'type', 'val', 'val2'])

pc = pc.set_index(['name', 'date', 'type']).sort_index()

res = pc[pc.index.duplicated(keep=False)]

# val val2
# name date type
# 0 1 2 3 4
# 2 4 5

根据 documentation :

keep : {‘first’, ‘last’, False}, default ‘first’

• first : Mark duplicates as True except for the first occurrence.
• last : Mark duplicates as True except for the last occurrence.
• False : Mark all duplicates as True.

关于python - 基于三列的重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49675866/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com