gpt4 book ai didi

recommendation-engine - 使用 SVD 和 Movielens/Netflix 类型数据集的基本伪代码

转载 作者:行者123 更新时间:2023-12-04 08:37:38 24 4
gpt4 key购买 nike

我正在努力弄清楚如何开始使用带有 MovieLens/Netflix 类型数据集的 SVD 进行评级预测。我非常感谢 python/java 中的任何简单示例,或所涉及过程的基本伪代码。有许多论文/帖子总结了整体概念,但我不确定如何开始实现它,即使使用了一些建议的库。

据我了解,我需要将我的初始数据集转换如下:

初始数据集:

    user    movie   rating
1 43 3
1 57 2
2 219 4

需要转为:
user        1   2
movie 43 3 0
57 2 0
219 0 4

此时,我是否只需将该矩阵注入(inject)可用库提供的 SVD 算法中,然后(以某种方式)提取结果,还是需要我做更多的工作?

我读过的一些信息:

http://www.netflixprize.com/community/viewtopic.php?id=1043
http://sifter.org/~simon/journal/20061211.html
http://www.slideshare.net/NYCPredictiveAnalytics/building-a-recommendation-engine-an-example-of-a-product-recommendation-engine
http://www.slideshare.net/bmabey/svd-and-the-netflix-dataset-presentation
..和其他一些论文

一些图书馆:
LingPipe(java)
Jama(java)
Pyrsvd(python)

任何提示都将不胜感激,尤其是在基本数据集上。
非常感谢,
奥利

最佳答案

SVDRecommender在 Apache Mahout 中。您关于输入格式的问题完全取决于您使用的库或代码。没有一个标准。在某种程度上,是的,代码将在内部构造某种矩阵。对于 Mahout,所有推荐器的输入,当作为文件提供时,是一个 CSV 文件,其行如 userID,itemID,rating .

关于recommendation-engine - 使用 SVD 和 Movielens/Netflix 类型数据集的基本伪代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5293802/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com