gpt4 book ai didi

python - 仅将属于最大组的行保留在 pandas 中

转载 作者:行者123 更新时间:2023-12-01 01:21:14 25 4
gpt4 key购买 nike

我有一个像这样的数据框:

df = pd.DataFrame({'id':['pt1','px1','t95','sx1','dc4', 'px5'],
'feature':['f7','f7', 'f7','f8','f8', 's1'],
'score':['2','3.3','4','8','4.9', '6']})

我想要:
1-计算“feature”列中每个组的组大小
(结果为 f7: 3;f8: 2;s1:1)
2- 找到最大组大小(即 f7: 3)
3-保留属于最大大小(f7)组的行并删除其余行

最终的 pd.DataFrame 将是:

id feature score
pt1 f7 2
px1 f7 3.3
t95 f7 4

谢谢

最佳答案

使用 GroupBy + tranformcount 以及额外的过滤步骤:

v = df.groupby('feature').feature.transform('count')
df[v.eq(v.max())]

id feature score
0 pt1 f7 2
1 px1 f7 3.3
2 t95 f7 4

关于python - 仅将属于最大组的行保留在 pandas 中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53813271/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com