gpt4 book ai didi

python - 保留列中项目出现次数最多的 Pandas 数据框行

转载 作者:行者123 更新时间:2023-12-05 08:45:32 26 4
gpt4 key购买 nike

我有一个 Pandas 数据框

import pandas as pd

df =pd.DataFrame({'name':['john','joe','bill','richard','sam'],
'cluster':['1','2','3','1','2']})

df['cluster'].value_counts() 将给出基于 cluster 列的项的出现次数。

是否可以只保留列 cluster 中出现次数最多的行?

预期的输出是

enter image description here

簇 1 和 2 的出现次数相同,因此需要保留簇 1 和 2 的所有行。

最佳答案

使用这个

# find the most common clusters then filter those clusters
df[df.cluster.isin(df.cluster.mode())]

enter image description here

关于python - 保留列中项目出现次数最多的 Pandas 数据框行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72425642/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com