gpt4 book ai didi

python - 如何在 Pandas : count, 删除列、删除重复项中更好地执行此步骤

转载 作者:太空宇宙 更新时间:2023-11-03 21:28:51 25 4
gpt4 key购买 nike

这是我的日常事务,我处理带有许多列的df,其中包括这两列:user事件。我计算每个用户事件数量,向原始df添加一个新列count。然后,我只保留存在多个相同行的 usercount,然后执行 drop_duplicates() 删除重复项,从而获取事件 每个用户的计数。我确信我正在做一些多余的工作。

完成此类任务的优雅方式是什么。

df['count'] = df.groupby('user')['event'].transform('count')
df = df[['user','count']]
df = df.drop_duplicates()
plt.bar(x=df['user'], height=df['count'])

最佳答案

使用GroupBy.count对于 Series,然后调用 Series.plot.bar :

df.groupby('user')['event'].count().plot.bar()

关于python - 如何在 Pandas : count, 删除列、删除重复项中更好地执行此步骤,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53666827/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com