gpt4 book ai didi

python - 如何使用 Python pandas “group by” 多个变量,消除重复项

转载 作者:太空宇宙 更新时间:2023-11-03 13:44:06 24 4
gpt4 key购买 nike

我有一个包含此类数据的输入文件:

**> Due big size of input file, i need to take only unique pairs -

userID-locationID (some kind of preprocessing)**

userID locationID
1 loc1
1 loc2
1 loc3
2 loc1
3 loc4
3 loc3
3 loc1

我必须找出在每个位置检查了多少不同的用户,并获取包含值的新列。我已经尝试过了,但这不是我需要的。

DataFrame({'count': df.groupby(["userID","locationID",]).size()}).reset_index()

最佳答案

这应该是你要找的,但我不确定是否有更简单的方法:

In [5]: df.groupby(['locID','userId']).last().groupby(level='locID').size()
Out[5]:
locID
loc1 3
loc2 1
loc3 2
loc4 1
dtype: int64

取每组的最后一个将删除重复项

关于python - 如何使用 Python pandas “group by” 多个变量,消除重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24049604/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com