gpt4 book ai didi

python - 在 pandas 中过滤、分组和计数?

转载 作者:行者123 更新时间:2023-11-30 22:10:13 24 4
gpt4 key购买 nike

TSV 文件包含一些用户事件数据:

user_uid category event_type
"11" "like" "post"
"33" "share" "status"
"11" "like" "post"
"42" "share" "post"

获取每个类别和每个 user_id 的 post 事件数量的最佳方法是什么?

我们应该显示以下输出:

user_uid category count
"11" "like" 2
"42" "share" 1

最佳答案

清除所有尾随空格,以便正确分组。过滤您的DataFrame,然后应用groupby + size

df['category'] = df.category.str.strip()
df['user_uid'] = df.user_uid.str.strip()
df[df.event_type == 'post'].groupby(['user_uid', 'category']).size()

输出:

user_uid  category
11 like 2
42 share 1
dtype: int64

关于python - 在 pandas 中过滤、分组和计数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51711306/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com