gpt4 book ai didi

python - 用非唯一标签切割的 Pandas

转载 作者:行者123 更新时间:2023-12-02 01:04:49 26 4
gpt4 key购买 nike

我正在尝试对数据进行分类并根据分类应用浮点值。我认为 pandas.cut 是用于此目的的工具,但显然它需要每个 bin 标签的唯一值。

values = [0.6, 0.5, 0.5, 0.6, 0.8, 0.9]
bins = [0, 2, 5, 10, 15, 25, 200]
binned = pd.cut(original_table[field], bins, labels=values)

>>> ValueError: Categorical categories must be unique

我的数据 (original_table) 非常大,迭代地做任何事情都非常慢,这就是为什么 cut 是一个很有吸引力的工具。是否有解决方法可以使 pd.cut 为此工作?

最佳答案

这是我发现的另一种规避此问题的方法 here .也看起来很快就会修复

import pandas as pd
import numpy as np


values = [0.6, 0.5, 0.5, 0.6, 0.8, 0.9]
bins = [0, 2, 5, 10, 15, 25, 200]

# Cut it
binned = pd.cut(original_table[field], bins, labels=pd.Categorical(values))

关于python - 用非唯一标签切割的 Pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48447147/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com