gpt4 book ai didi

python - 计算 Pandas 中相应值的频率[python 3]

转载 作者:太空宇宙 更新时间:2023-11-04 00:38:26 25 4
gpt4 key购买 nike

我的数据集具有以下值:

var1  var2 
1234 abc
2345 bcs
5678 csd
1234 abc
1234 bcs
5678 csd
1234 bcs
1234 xyz
1234 abc
9101 zzz

我需要对 var1 列中的每个唯一值进行计数并显示 var2 中相应值的前 3 个频率计数,并获得输出,例如:

var1  var2  count
1234 abc 3
1234 bcs 2
1234 xyz 1
5678 csd 2
9101 zzz 1

最有效的方法是什么?

最佳答案

你需要包含nlargest

df.groupby('var1').var2.apply(lambda x: x.value_counts().nlargest(3)) \
.reset_index(name='count').rename(columns={'level_1': 'var2'})

var1 var2 count
0 1234 abc 3
1 1234 bcs 2
2 1234 xyz 1
3 2345 bcs 1
4 5678 csd 2
5 9101 zzz 1

关于python - 计算 Pandas 中相应值的频率[python 3],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42891671/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com