gpt4 book ai didi

python - 尝试在 python 中创建分组变量

转载 作者:行者123 更新时间:2023-12-01 04:17:30 26 4
gpt4 key购买 nike

我有一列年龄值,需要将其转换为 18-29、30-39、40-49、50-59、60-69 和 70+ 的年龄范围:

对于 df"file"中的一些数据的示例,我有:

enter image description here

并且想要到达:

enter image description here

我尝试了以下方法:

file['agerange'] = file[['age']].apply(lambda x: "18-29" if (x[0] > 16
or x[0] < 30) else "other")

我不想只进行分组,因为存储桶大小不统一,但如果它有效,我愿意将其作为解决方案。

提前致谢!

最佳答案

看来您正在使用 Pandas 库。它们包含一个用于执行此操作的函数: http://pandas.pydata.org/pandas-docs/version/0.16.0/generated/pandas.cut.html

这是我的尝试:

import pandas as pd

ages = pd.DataFrame([81, 42, 18, 55, 23, 35], columns=['age'])

bins = [18, 30, 40, 50, 60, 70, 120]
labels = ['18-29', '30-39', '40-49', '50-59', '60-69', '70+']
ages['agerange'] = pd.cut(ages.age, bins, labels = labels,include_lowest = True)

print(ages)

age agerange
0 81 70+
1 42 40-49
2 18 18-29
3 55 50-59
4 23 18-29
5 35 30-39

关于python - 尝试在 python 中创建分组变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34165876/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com