gpt4 book ai didi

python - 将案例过多的 groupby 结果分组到 "trash bin"级别

转载 作者:行者123 更新时间:2023-12-05 09:07:46 25 4
gpt4 key购买 nike

出于报告目的,我需要“简化”pandas DataFrame 中由分组操作产生的罕见事件。

让我们以这个 DataFrame 为例,我在其中使用 colA 来计算 colB 中值的出现次数

df = pd.DataFrame(data={'colA':['a','b','c','d','e','a','a','b','b','a'],'colB':[1,2,3,4,5,1,1,2,2,1]})

df_grouped = df.groupby(['colA']).agg('count')

结果是:

      colB
colA
a 4
b 3
c 1
d 1
e 1

我想从这个分组的数据框中获取一个新的数据框,其中最不频繁的值,即对应于 colA={'c','d','e'} 的值被分组在一个名为 'other'colA 级别的新值,它包含所有这些的总数,如下所示:

       colB
colA
a 4
b 3
other 3

有没有一种简单的方法可以执行这种“将稀有元素放入垃圾箱”操作?此外,在存在 MultiIndex 的情况下我该怎么做?

最佳答案

让我们在线完成

out = df.rename(index=dict.fromkeys(df[df.colB<2].index,'other')).sum(level=0)
Out[189]:
colB
colA
a 4
b 3
other 3

关于python - 将案例过多的 groupby 结果分组到 "trash bin"级别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64451989/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com