gpt4 book ai didi

python - 使用 python,选择长于 N 的重复元素

转载 作者:太空狗 更新时间:2023-10-29 20:35:43 26 4
gpt4 key购买 nike

假设我有一个数据框如下:

df = pd.DataFrame({'A':[1,1,2,3,3,3,3,3,4,4,4,4,4,4,4,5,5,5,5,6,6]})

df
Out[1]:
A
0 1
1 1
2 2
3 3
4 3
5 3
6 3
7 3
8 4
9 4
10 4
11 4
12 4
13 4
14 4
15 5
16 5
17 5
18 5
19 6
20 6

我正在尝试过滤重复 4 次或更多次的数字,输出将是:

df1
Out[2]:
A
0 3
1 3
2 3
3 3
4 3
5 4
6 4
7 4
8 4
9 4
10 4
11 4
12 5
13 5
14 5
15 5

现在我正在使用 itemfreq 来提取该信息,这会产生一系列数组,然后在其中进行条件设置并仅过滤这些数字很复杂。我认为必须有其他最简单的方法来做到这一点。一些想法?谢谢!

最佳答案

groupby.filter 可能是最简单的方法:

df.groupby('A').filter(lambda x: x.size > 3)
Out:
A
3 3
4 3
5 3
6 3
7 3
8 4
9 4
10 4
11 4
12 4
13 4
14 4
15 5
16 5
17 5
18 5

关于python - 使用 python,选择长于 N 的重复元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46007571/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com