gpt4 book ai didi

python - 强制 qcut 分成等概率的组

转载 作者:太空宇宙 更新时间:2023-11-03 13:58:40 24 4
gpt4 key购买 nike

考虑以下数据:

s = pd.Series([1, 1, 1, 2])
pd.qcut(s, 2, labels=False)

我想要等概率组,即 [0, 0, 1, 1]。相反,qcut 可以引发异常或返回 [0, 0, 0, 0](取决于 duplicates kwarg)。

我通过稍微扰乱数据得到了等概率组,即:

def my_qcut(s, *args, **kwargs):
disturbed = np.array(s) + np.random.rand(len(s)) / 1000
return pd.qcut(disturbed, *args, **kwargs)

虽然看起来可行,但我觉得这太hack了。谁能就 split 成等概率组的确定性方法向我提供建议?

最佳答案

尝试:

pd.qcut(s.rank(method='first'), 2, labels=np.arange(2))

关于python - 强制 qcut 分成等概率的组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52058260/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com