gpt4 book ai didi

python - Python 中对变量进行装箱的有效方法

转载 作者:行者123 更新时间:2023-12-01 08:59:05 24 4
gpt4 key购买 nike

全部,

我是 python 新手,正在尝试将数据分类到容器中。

假设,我有 2 列“年龄”和“购买情况”。年龄是连续变量,购买是二元变量(1-是,0-否)。我想将年龄分类到垃圾箱中,并查看每个垃圾箱中的购买总数。

我编写了以下代码,但我真诚地相信有更有效的方法可以做到这一点。请检查以下内容并提出新方法或增强功能的建议。

代码:

bins = [15, 30, 40, 50, 60, np.inf]

names = ['15-30', '30-40', '40-50', '50-60', '60+']

dataset['AgeRange'] = pd.cut(dataset['Age'], bins, labels=names)

df = [ dataset[dataset.AgeRange == '15-30'].Purchased.sum(),
dataset[dataset.AgeRange == '30-40'].Purchased.sum(),
dataset[dataset.AgeRange == '40-50'].Purchased.sum(),
dataset[dataset.AgeRange == '50-60'].Purchased.sum() ]

谢谢!!!

最佳答案

您应该查看DataFrame.groupby 。另请考虑使用列表理解来创建标签:

bins = [15, 30, 40, 50, 60, np.inf]
labels = [f'{i}+' if j==np.inf else f'{i}-{j}' for i, j in zip(bins, bins[1:])]

dataset['AgeRange'] = pd.cut(dataset['Age'], bins, labels)
dataset.groupby('AgeRange')['Purchased'].sum()

关于python - Python 中对变量进行装箱的有效方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52612524/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com