gpt4 book ai didi

python - 具有两个分类变量的数据帧上的 Groupby 和 count()

转载 作者:行者123 更新时间:2023-11-28 20:59:04 24 4
gpt4 key购买 nike

<分区>

我有一个数据集,我需要对其进行 groupby() 并找到每个唯一组合的计数。

    body-style        make
0 convertible alfa-romeo
1 convertible alfa-romeo
2 hatchback alfa-romeo
3 sedan audi
4 sedan audi

我的需求是生成如下所示的输出:

             make   body-style   count
0 alfa-romero convertible 2
1 alfa-romero hatchback 1
2 audi sedan 2

尝试了下面的代码:

body = pd.DataFrame({'make':['alfa-romeo','alfa-romeo','alfa-romeo','audi','audi'], 'body-style':['convertible','convertible','hatchback','sedan','sedan']})

body.groupby(by=['make','body-style'], as_index=False).count()

此聚合引发“列表索引超出范围”错误。但是,当我从 groupby 子句中删除任一列时,它能够给我按剩余列分组的计数。

如果我删除 as_index=False,没有错误,但生成的对象将包含两列 - makebody-style作为索引的一部分,不会有任何计数数据。

我可以向 datframe 添加另一列,用 1 填充它,并在 groupby 上使用 sum() 而不是 count()。但是想知道是否有更简洁的方法来执行此操作。

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com