- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在根据查询日志构建推荐系统。对于每个查询日志,我都有用户单击哪些链接的数据。用户不对他们访问的链接提供任何评级。我正在尝试创建一个推荐系统,该系统会建议“如果您单击了这个,请尝试另一个类似用户尝试过的这个”。我正在探索 Apache Spark - MLLib 以使用协作过滤来达到此目的。不幸的是,ALS 算法需要“评级”数据。
这是我在网上找到的解决方案之一:
“对于我们想要推荐的每个页面,我们都会搜索浏览过该页面的所有用户。然后,对于每个用户,我们会查找他们浏览过的所有其他页面。然后我们计算推荐的用户数量已查看此数据集中的每个页面,并使用计数最高的页面作为我们的建议。”
用户认为这种方法很慢。
我想知道是否有一个好的方法来“伪造”排名数据,或者是否有一个不需要排名数据的流行开源实现?
最佳答案
在隐式反馈的情况下,评级也可以被计数。例如 (user1, url1, 1/0), 1/0 是否点击。
现在你问一个不同的问题,无论如何,稀疏矩阵和稠密矩阵之间是有区别的。您不需要添加任何 0,这就是评级的想法,您有那些您点击过的评级,例如 (u1,url1,1),如果这是用户 1 单击的唯一 url,那么您就这样做不需要为那些他还没有点击的添加ceros。该模型知道这是正在使用的输入数据格式。
希望对您有所帮助。
关于machine-learning - 基于 MLlib 项目的无评级协同过滤,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37166701/
我想插入 备注 关于要在我的 latex 文档的特定位置进行的修复 也许有一个 列表的“待办事项/修复我” 你怎么处理这个? 似乎一种方法是使用 fixme 包,但我无法使其工作。 有人在用吗? 最佳
错误:无法创建表。我已经创建了一个数据库,并且已经提供了所有特权。但仍然无法登录协作模块。我受够了,但我不想放弃。我已经尝试了所有可能的方法,但都行不通。 Stackoverflow 是我所知道的最好
我是一名优秀的程序员,十分优秀!