gpt4 book ai didi

python - 如何使用 Pandas 对一系列值进行编码

转载 作者:太空宇宙 更新时间:2023-11-03 14:05:22 26 4
gpt4 key购买 nike

我有一个 pandas 数据框,并且有一列 age。我想将它编码成由特定范围分隔的分类值,例如,15 岁以下应为 0,15 至 30 岁应更改为 1 等等。

我找到了这种方法(在经历了关于使用 &and 的巨大困惑之后)

age = X.loc[:, 'Age']

age[ age<15 ] = 0
age[ (15<age) & (age<=30) ] = 1
age[ (30<age) & (age<=50) ] = 2
age[ (50<age) & (age<=80) ] = 3

这是最好的方法吗?我可以这样做吗,例如使用 LabelEncoder?

最佳答案

您可以使用 cut :

df = pd.DataFrame({'Age':[0,1,14,15,30,31,50,51,79,80]})

bins = [0,14,30,50,80]
labels=[0,1,2,3]
df['bins'] = pd.cut(df['Age'], bins=bins, labels=labels, include_lowest=True)
print (df)
Age bins
0 0 0
1 1 0
2 14 0
3 15 1
4 30 1
5 31 2
6 50 2
7 51 3
8 79 3
9 80 3

关于python - 如何使用 Pandas 对一系列值进行编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44151071/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com