gpt4 book ai didi

python - 如何删除指定行的 Pandas 数据框

转载 作者:太空宇宙 更新时间:2023-11-04 05:14:17 24 4
gpt4 key购买 nike

我是 python 的新手,对于我犯的任何错误,我希望你能理解我。

我遇到了一个问题,比如删除重复的行。但在这里我认为 1,2 与 2,1 相同。而且 pandas 数据框中没有任何实际重复的项目。例如,我有 df 作为

first second
1 2
2 1
2 4
4 2

我需要 df 最终成为:

first second
1 2
2 4

如何解决这个问题。提前致谢。

更新

这里还有一个问题,dataframe有1860000行,所以使用这个方法会引发内存错误。有什么方法可以解决这个问题吗?

最佳答案

您可以使用 applysorted 然后 drop_duplicates :

print (df.apply(sorted, axis=1))
first second
0 1 2
1 1 2
2 2 4
3 2 4

df = df.apply(sorted, axis=1).drop_duplicates()
print (df)
first second
0 1 2
2 2 4

关于python - 如何删除指定行的 Pandas 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42160134/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com