gpt4 book ai didi

machine-learning - 基于 MLlib 项目的无评级协同过滤

转载 作者:行者123 更新时间:2023-11-30 09:54:28 24 4
gpt4 key购买 nike

我正在根据查询日志构建推荐系统。对于每个查询日志,我都有用户单击哪些链接的数据。用户不对他们访问的链接提供任何评级。我正在尝试创建一个推荐系统,该系统会建议“如果您单击了这个,请尝试另一个类似用户尝试过的这个”。我正在探索 Apache Spark - MLLib 以使用协作过滤来达到此目的。不幸的是,ALS 算法需要“评级”数据。

这是我在网上找到的解决方案之一:

“对于我们想要推荐的每个页面,我们都会搜索浏览过该页面的所有用户。然后,对于每个用户,我们会查找他们浏览过的所有其他页面。然后我们计算推荐的用户数量已查看此数据集中的每个页面,并使用计数最高的页面作为我们的建议。”

用户认为这种方法很慢。

我想知道是否有一个好的方法来“伪造”排名数据,或者是否有一个不需要排名数据的流行开源实现?

最佳答案

在隐式反馈的情况下,评级也可以被计数。例如 (user1, url1, 1/0), 1/0 是否点击。

现在你问一个不同的问题,无论如何,稀疏矩阵和稠密矩阵之间是有区别的。您不需要添加任何 0,这就是评级的想法,您有那些您点击过的评级,例如 (u1,url1,1),如果这是用户 1 单击的唯一 url,那么您就这样做不需要为那些他还没有点击的添加ceros。该模型知道这是正在使用的输入数据格式。

希望对您有所帮助。

关于machine-learning - 基于 MLlib 项目的无评级协同过滤,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37166701/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com