gpt4 book ai didi

python - 在 Pandas DF 中创建一个按年龄类别分组的新列

转载 作者:行者123 更新时间:2023-12-04 07:38:33 25 4
gpt4 key购买 nike

我是编码新手,所以我很抱歉问什么可能是一个愚蠢而简单的问题。我在网上搜索并阅读了文档,但找不到答案,4 小时后我希望得到指导。
我有一个名为 的 Pandas DataFrame “数据” . “数据”有一个年龄列,有很多不同的年龄。我想隔离某些年龄组以进行不同类型的分析。就像年轻人锻炼了多少小时一样(在 snsplot 中)。
在我看来,解决这个问题的最好方法是在“数据”中添加一个包含 age_group 的列。为年龄组分配了一些逻辑(如附图所示)
我可能是错的,就像我说的,我只有几个月才开始学习 Python。感谢您提供的任何帮助。一旦我知道如何做,我计划在更多的专栏上这样做。
我试图根据我正在寻找的年龄组创建变量

teenage = data[data['age']<=19]
yadult = data[data['age'].between(20,24)]
adult = data[data['age'].between(25,39)]
older_adult = data[data['age']>39]
当我尝试在 snsplot 中使用变量时,这不起作用.
所以我然后尝试了这个:
data['yadult'] = data[data['age'].between(20,24)] 
但出现错误:
“ValueError:错误的项目数通过了 9,放置意味着 1

这里的最终目标是让“数据”DataFrame 带有一个带有年龄组的全新列。像下面。


产品
年龄
性别
教育
....
年龄阶层


TM195
18
男性
14
......
青少年

TM195
27
男性
16
......
成人


.csv 数据布局:

我正在尝试创建的存储桶:

最佳答案

使用以下代码,您可以分配一个新列 age_group根据 age :

data.loc[data['age']<=19, 'age_group'] = 'teenage'
data.loc[data['age'].between(20,24), 'age_group'] = 'yadult'
data.loc[data['age'].between(25,39), 'age_group'] = 'adult'
data.loc[data['age']>39, 'age_group'] = 'older_adult'

关于python - 在 Pandas DF 中创建一个按年龄类别分组的新列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67612603/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com