gpt4 book ai didi

python - 如何删除 Pandas 中的配对重复?

转载 作者:行者123 更新时间:2023-12-01 12:11:46 25 4
gpt4 key购买 nike

这个问题在这里已经有了答案:





Remove reverse duplicates from dataframe

(5 个回答)


3年前关闭。




我有数据集,数据集有配对重复。这是我的数据

Id    antecedent           descendant
1 one two
2 two one
3 two three
4 one three
5 three two

这是我需要的,因为 one, two等于 two, one所以我想删除重复的对
Id    antecedent           descendant
1 one two
3 two three
4 one three

最佳答案

使用 numpy.sort 使用 duplicated 对每行进行排序对于 bool 掩码:

df1 = pd.DataFrame(np.sort(df[['antecedent','descendant']], axis=1))

或者:
#slowier solution
#df1 = df[['antecedent','descendant']].apply(frozenset, 1)
df = df[~df1.duplicated()]
print (df)
Id antecedent descendant
0 1 one two
2 3 two three
3 4 one three

关于python - 如何删除 Pandas 中的配对重复?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51303571/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com