gpt4 book ai didi

machine-learning - 实现无监督学习的推荐系统

转载 作者:行者123 更新时间:2023-11-30 08:29:18 25 4
gpt4 key购买 nike

我一直在研究有关推荐系统以及构建推荐系统的建议方法的论文和书籍。其中许多都以 Netflix 竞赛为例。在 Netflix 上,用户对电影进行评分(从 1 到 5)。在那场比赛中,参赛者获得了一个电影数据库和相应的用户评分,他们应该实现一个能够最好地预测电影评分的系统,并使用该评分向用户推荐电影。

对于评估,他们建议使用使用预测和实际评分作为参数的措施进行交叉验证。预测评分是使用用户的历史记录及其对电影的评分来计算的。

我正在尝试建立一个新闻推荐系统。我现在面临的问题是,这些新闻的相关性很短,几乎没有人会对新闻进行评级。所以,我只有隐式反馈(观点),没有显式反馈(评级)。此外,在 Netflix 问题中,他们还提供了一个数据库。我想知道如何应对冷启动问题,因为一开始就不会读取(查看)任何新闻。

如何避免冷启动问题,一旦我有了一个算法,我如何测试它是否正常工作?

最佳答案

电影是经典协同过滤的一个很好的用例:它们是人们长期感兴趣的项目,数量相对较少,许多人有重叠的兴趣,并且星级是有意义的。新闻报道完全不同。考虑基于内容的过滤,而不是协作过滤。这就是人们的兴趣与内容标识符(可以是有关新闻报道或发布者的关键字,或有关一天中的时间或世界地区的元数据)的地方。观看次数是了解人们偏好信息的最佳选择,它们还允许您使用一些数据挖掘技术,例如关联规则挖掘。

虽然您仍然会遇到用户冷启动问题 - 您系统中的新用户没有向您提供有关她的偏好的任何信息,除非您通过挖掘她的推文或 Facebook 兴趣或类似内容来引导它 -您可以避免项目冷启动问题。您可以使用另一个语料库,而不是依靠社区中阅读的新闻报道作为获得项目相似性的唯一方法。特别是,尝试维基百科,并查看 WikiBrain ( https://github.com/shilad/wikibrain )。这是一个 API,通过它您可以获取一个概念与另一个概念的相似度,并将其应用于您的推荐需求。

关于machine-learning - 实现无监督学习的推荐系统,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28098989/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com