gpt4 book ai didi

python - 删除 Pandas DataFrame 中重复超过 5 次的值

转载 作者:太空宇宙 更新时间:2023-11-04 05:55:22 25 4
gpt4 key购买 nike

我正在使用 pandas 处理 csv 文件。如果它们连续出现,我需要删除一些重复值。我知道有一个重复函数可以删除第二次重复的任何值,而不管它们出现在哪里。但是只有当列的值重复超过 5 个连续行时,我才必须删除数据。例如,

     1
1
3
1
1
1
1
1
2

这里我不想删除 B 中顶部的两个 1,而是只删除连续重复 5 次的 1。关于我应该如何处理的任何指示?

最佳答案

应该这样做:

>> df = pd.Series([1,1,3,1,1,1,1,1,2])
>> df.groupby((df.shift() != df).cumsum())\
.filter(lambda x: len(x) < 5)
0 1
1 1
2 3
8 2

关于python - 删除 Pandas DataFrame 中重复超过 5 次的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28109256/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com