gpt4 book ai didi

python-3.x - numpy中的groupby,计数和平均值,python中的pandas

转载 作者:行者123 更新时间:2023-12-03 22:53:26 24 4
gpt4 key购买 nike

我有一个看起来像这样的数据框:

       userId  movieId  rating
0 1 31 2.5
1 1 1029 3.0
2 1 3671 3.0
3 2 10 4.0
4 2 17 5.0
5 3 60 3.0
6 3 110 4.0
7 3 247 3.5
8 4 10 4.0
9 4 112 5.0
10 5 3 4.0
11 5 39 4.0
12 5 104 4.0

我需要获取一个数据框,它具有唯一的 userId、用户的评分数和用户的平均评分,如下所示:
       userId    count    mean
0 1 3 2.83
1 2 2 4.5
2 3 3 3.5
3 4 2 4.5
4 5 3 4.0

有人可以帮忙吗?

最佳答案

掉落 movieId由于我们没有使用它,groupby userId ,然后应用聚合方法:

import pandas as pd

df = pd.DataFrame({'userId': [1,1,1,2,2,3,3,3,4,4,5,5,5],
'movieId':[31,1029,3671,10,17,60,110,247,10,112,3,39,104],
'rating':[2.5,3.0,3.0,4.0,5.0,3.0,4.0,3.5,4.0,5.0,4.0,4.0,4.0]})

df = df.drop('movieId', axis=1).groupby('userId').agg(['count','mean'])

print(df)

其中产生:
       rating          
count mean
userId
1 3 2.833333
2 2 4.500000
3 3 3.500000
4 2 4.500000
5 3 4.000000

关于python-3.x - numpy中的groupby,计数和平均值,python中的pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43456149/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com