gpt4 book ai didi

python - Pandas groupby 如何计算范围内的计数

转载 作者:太空狗 更新时间:2023-10-30 00:32:03 47 4
gpt4 key购买 nike

假设我有一个巨大的 0 到 100 之间的数字列表。我根据最大数量计算范围,然后说有 10 个 bin。所以我的范围是例如

ranges = [0,10,20,30,40,50,60,70,80,90,100]

现在我计算每个范围内的出现次数,从 0-10、10-20 等等。我遍历列表中的每个数字并检查范围。我认为这不是运行时速度方面的最佳方式。

我可以用 pandas 来固定它吗? pandas.groupby,怎么样?

最佳答案

我们可以使用pd.cut将值放入范围内,然后我们可以 groupby这些范围,最后调用 count计算现在分箱到这些范围内的值:

np.random.seed(0)
df = pd.DataFrame({"a": np.random.random_integers(1, high=100, size=100)})
ranges = [0,10,20,30,40,50,60,70,80,90,100]
df.groupby(pd.cut(df.a, ranges)).count()

a
a
(0, 10] 11
(10, 20] 10
(20, 30] 8
(30, 40] 13
(40, 50] 11
(50, 60] 9
(60, 70] 10
(70, 80] 11
(80, 90] 13
(90, 100] 4

关于python - Pandas groupby 如何计算范围内的计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25010215/

47 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com