gpt4 book ai didi

python - 将数据分箱到相同大小的箱中

转载 作者:行者123 更新时间:2023-12-05 00:55:38 25 4
gpt4 key购买 nike

我想将值分箱到大小相等的箱中。假设我们有以下 Pandas 系列:

ex = pd.Series([1,2,3,4,5,6,7,888,999])

现在,我想创建三个垃圾箱:

pd.cut(ex, 3, labels=False)

这会产生三个 bin,并将以下 bin 编号分配给系列的每个元素:

[0,0,0,0,0,0,0,2,2]

现在,我想设置 bin 边界,使每个 bin 具有相同数量的元素(即 3),并且将数据点分配给 bin 应如下所示:

[0,0,0,1,1,1,2,2,2]

我怎样才能做到这一点?并且应该怎么做才能打破平局(即当数据点的数量不能被 bin 的数量整除时)?

最佳答案

使用-

pd.qcut(ex, 3, labels=False)

输出

0    0
1 0
2 0
3 1
4 1
5 1
6 2
7 2
8 2

使用 retbins=True 获取垃圾箱。

pd.qcut(ex, 3, labels=False, retbins=True)

输出

(0    0
1 0
2 0
3 1
4 1
5 1
6 2
7 2
8 2
dtype: int64,
array([ 1. , 3.66666667, 6.33333333, 999. ]))

关于python - 将数据分箱到相同大小的箱中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63850267/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com