gpt4 book ai didi

python - 使用带有 IntervalIndex 的 pandas.cut 后如何重命名类别?

转载 作者:行者123 更新时间:2023-11-28 18:58:43 31 4
gpt4 key购买 nike

我使用 pandas.cut 离散化了数据框中的一列由 IntervalIndex.from_tuples 创建的垃圾箱.

剪切按预期工作,但类别显示为我在 IntervalIndex 中指定的元组.有没有办法将类别重命名为不同的标签,例如(小、中、大)?

例子:

bins = pd.IntervalIndex.from_tuples([(0, 1), (2, 3), (4, 5)])
pd.cut([0, 0.5, 1.5, 2.5, 4.5], bins)

生成的类别将是:

[NaN, (0, 1], NaN, (2, 3], (4, 5]]
Categories (3, interval[int64]): [(0, 1] < (2, 3] < (4, 5]]

我正在尝试更改 [(0, 1] < (2, 3] < (4, 5]]变成类似 1, 2 ,3 的东西或 small, medium ,large .

遗憾的是,当使用 IntervalIndex 时,pd.cut 的标签参数参数被忽略。

谢谢!

更新:

感谢@SergeyBushmanov,我注意到这个问题仅在尝试更改数据框内的类别标签时存在(这正是我正在尝试做的)。更新示例:

In [1]: df = pd.DataFrame([0, 0.5, 1.5, 2.5, 4.5], columns = ['col1'])
In [2]: bins = pd.IntervalIndex.from_tuples([(0, 1), (2, 3), (4, 5)])
In [3]: df['col1'] = pd.cut(df['col1'], bins)
In [4]: df['col1'].categories = ['small','med','large']

In [5]: df['col1']

Out [5]:
0 NaN
1 (0, 1]
2 NaN
3 (2, 3]
4 (4, 5]
Name: col1, dtype: category
Categories (3, interval[int64]): [(0, 1] < (2, 3] < (4, 5]]

最佳答案

如果我们有一些数据:

bins = pd.IntervalIndex.from_tuples([(0, 1), (2, 3), (4, 5)])
x = pd.cut([0, 0.5, 1.5, 2.5, 4.5], bins)

您可以尝试重新分配类别,例如:

In [7]: x.categories = [1,2,3]

In [8]: x
Out[8]:
[NaN, 1, NaN, 2, 3]
Categories (3, int64): [1 < 2 < 3]

或:

In [9]: x.categories = ["small", "medium", "big"]                         

In [10]: x
Out[10]:
[NaN, small, NaN, medium, big]
Categories (3, object): [small < medium < big]

更新:

df = pd.DataFrame([0, 0.5, 1.5, 2.5, 4.5], columns = ['col1'])
bins = pd.IntervalIndex.from_tuples([(0, 1), (2, 3), (4, 5)])
x = pd.cut(df["col1"].to_list(),bins)
x.categories = [1,2,3]
df['col1'] = x
df.col1
0 NaN
1 1
2 NaN
3 2
4 3
Name: col1, dtype: category
Categories (3, int64): [1 < 2 < 3]

更新 2:

在较新版本的 pandas 中,不是使用 x.categories = [1, 2, 3] 重新分配类别,而是应该使用 x.cat.rename_categories:

labels = [1, 2, 3]
x.cat.rename_categories(labels, inplace=True)

labels 可以是任何类型,在任何情况下,创建 pd.IntervalIndex 时设置的原始分类顺序将被保留。

关于python - 使用带有 IntervalIndex 的 pandas.cut 后如何重命名类别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55204418/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com