gpt4 book ai didi

machine-learning - 为什么交替最小二乘法是 "best used in systems that are centered around implicit data"?

转载 作者:行者123 更新时间:2023-11-30 09:51:11 25 4
gpt4 key购买 nike

我正在浏览论文Netflix prize and SVD作者:Stephen Gower,旨在了解 Netflix 奖项的解决方案。在“学习算法”部分中指出:“ALS 最适合用于以隐式数据为中心的系统”,而不是用户对项目的显式反馈评级。我在论文中找不到对此的进一步讨论。

为什么会出现这样的情况呢?

最佳答案

显式数据由用户对电影的评分组成。隐式数据考虑了用户的行为;他们看了电影多久、看了多少次、搜索历史记录..因此,隐式数据集要大得多,可以代表所有用户,而显式数据集仅代表经常评价电影的用户。对于显式数据,存在大量缺失值,因此模型的目标是仅根据用户的其他评分来填充所有用户缺失的评分值。另一方面,隐式模型根据有关用户的许多因素、有关电影的因素以及这些因素之间的关系来确定用户喜欢特定电影的可能性。 ALS 都能够为隐式和显式数据集形成模型,但隐式数据集可以更好地表示用户,因此隐式模型也是如此。

从数学上讲,可以使用单个方程创建显式模型,而隐式模型则使用方程组来形成模型。

http://yifanhu.net/PUB/cf.pdf上面的文章提到了显式与隐式一些。

关于machine-learning - 为什么交替最小二乘法是 "best used in systems that are centered around implicit data"?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44895513/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com