machine-learning - 基于 MLlib 项目的无评级协同过滤-6ren

machine-learning - 基于 MLlib 项目的无评级协同过滤

转载作者：行者123 更新时间：2023-11-30 09:54:28

24

4

我正在根据查询日志构建推荐系统。对于每个查询日志，我都有用户单击哪些链接的数据。用户不对他们访问的链接提供任何评级。我正在尝试创建一个推荐系统，该系统会建议“如果您单击了这个，请尝试另一个类似用户尝试过的这个”。我正在探索 Apache Spark - MLLib 以使用协作过滤来达到此目的。不幸的是，ALS 算法需要“评级”数据。

这是我在网上找到的解决方案之一:

“对于我们想要推荐的每个页面，我们都会搜索浏览过该页面的所有用户。然后，对于每个用户，我们会查找他们浏览过的所有其他页面。然后我们计算推荐的用户数量已查看此数据集中的每个页面，并使用计数最高的页面作为我们的建议。”

用户认为这种方法很慢。

我想知道是否有一个好的方法来“伪造”排名数据，或者是否有一个不需要排名数据的流行开源实现？

最佳答案

在隐式反馈的情况下，评级也可以被计数。例如 (user1, url1, 1/0), 1/0 是否点击。

现在你问一个不同的问题，无论如何，稀疏矩阵和稠密矩阵之间是有区别的。您不需要添加任何 0，这就是评级的想法，您有那些您点击过的评级，例如 (u1,url1,1)，如果这是用户 1 单击的唯一 url，那么您就这样做不需要为那些他还没有点击的添加ceros。该模型知道这是正在使用的输入数据格式。

希望对您有所帮助。

关于machine-learning - 基于 MLlib 项目的无评级协同过滤，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37166701/

24

4

0

文章推荐： machine-learning - 如何用caffe实现maxout？

文章推荐： machine-learning - 使用循环神经网络进行时间序列预测

latex - 协同 latex
我想插入备注关于要在我的 latex 文档的特定位置进行的修复也许有一个列表的“待办事项/修复我” 你怎么处理这个？似乎一种方法是使用 fixme 包，但我无法使其工作。有人在用吗？最佳
php - 错误 : Tables could not be created.(协同 php)
错误:无法创建表。我已经创建了一个数据库，并且已经提供了所有特权。但仍然无法登录协作模块。我受够了，但我不想放弃。我已经尝试了所有可能的方法，但都行不通。 Stackoverflow 是我所知道的最好

首页

博学

6Ren·AI

商城

machine-learning - 基于 MLlib 项目的无评级协同过滤