gpt4 book ai didi

python - 根据条件删除 Pandas 数据框中的重复行

转载 作者:太空宇宙 更新时间:2023-11-03 13:10:55 27 4
gpt4 key购买 nike

            is_avail   valu data_source
2015-08-07 False 0.282 source_a
2015-08-07 False 0.582 source_b
2015-08-23 False 0.296 source_a
2015-09-08 False 0.433 source_a
2015-10-01 True 0.169 source_b

在上面的数据框中,我想通过在 valu 列中保留具有较高值的​​行来删除重复行(即重复索引的行)。

我可以像这样删除具有重复索引的行:

df = df[~df.index.duplicated()]。但是如何根据上面指定的条件删除呢?

最佳答案

在按值对 df 进行排序后,您可以在索引上使用 groupby。

df.sort_values(by='valu', ascending=False).groupby(level=0).first()
Out[1277]:
is_avail valu data_source
2015-08-07 False 0.582 source_b
2015-08-23 False 0.296 source_a
2015-09-08 False 0.433 source_a
2015-10-01 True 0.169 source_b

关于python - 根据条件删除 Pandas 数据框中的重复行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43814487/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com