gpt4 book ai didi

python - 删除 Pandas 所有列中具有相同值的重复行

转载 作者:行者123 更新时间:2023-11-28 20:36:38 26 4
gpt4 key购买 nike

我有一个包含大约 50 万行的数据框。如我所见,有很多重复行,那么如何删除所有列(大约 80 列)中具有相同值的重复行,而不仅仅是一列?

df:

period_start_time    id    val1    val2    val3
06.13.2017 22:00:00 i53 32 2 10
06.13.2017 22:00:00 i32 32 2 10
06.13.2017 22:00:00 i32 4 2 8
06.13.2017 22:00:00 i32 4 2 8
06.13.2017 22:00:00 i32 4 2 8
06.13.2017 22:00:00 i20 7 7 22
06.13.2017 22:00:00 i20 7 7 22

期望的输出:

period_start_time    id    val1    val2    val3
06.13.2017 22:00:00 i53 32 2 10
06.13.2017 22:00:00 i32 32 2 10
06.13.2017 22:00:00 i32 4 2 8
06.13.2017 22:00:00 i20 7 7 22

最佳答案

使用drop_duplicates :

df = df.drop_duplicates()
print (df)
period_start_time id val1 val2 val3
0 06.13.2017 22:00:00 i53 32 2 10
1 06.13.2017 22:00:00 i32 32 2 10
2 06.13.2017 22:00:00 i32 4 2 8
5 06.13.2017 22:00:00 i20 7 7 22

关于python - 删除 Pandas 所有列中具有相同值的重复行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44759840/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com