gpt4 book ai didi

python - 在这种情况下如何使用 get_dummies() ?

转载 作者:太空宇宙 更新时间:2023-11-03 13:58:03 25 4
gpt4 key购买 nike

我需要对 userId X movieId 进行分类,我有两列:userIdmovieId

userId  movieId
60265 2123
60265 2291
60265 2329
60265 2355
60265 2389
60265 2396
60265 2402
60265 2403
60265 2421
19254 2389
19254 2396
19254 2402
19254 2403
19254 2421
19254 2123
19254 2291
19254 2329

每个 userId 都有不止一部 movieId 看过。我假装使用直方图来分布每个用户观看的所有电影。

userId/movieId  2123  2291  2329  2355  2389  2396  2402  2403  2421  2592  2596
60265 1 1 1 1 1 1 1 1 1 0 0
19254 1 1 1 0 1 1 1 1 1 0 0

如何使用函数 get_dummies() 构造一个相似的 userId X movieId 表?

最佳答案

你像这样使用 pd.get_dummies:

(pd.get_dummies(df.set_index('userId'), columns=['movieId'], prefix='', prefix_sep='')
.sum(level=0)
.reset_index())

输出:

   userId  2123  2291  2329  2355  2389  2396  2402  2403  2421
0 60265 1 1 1 1 1 1 1 1 1
1 19254 1 1 1 0 1 1 1 1 1

关于python - 在这种情况下如何使用 get_dummies() ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52784074/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com