gpt4 book ai didi

mahout - 根据项目属性查找相似项目

转载 作者:行者123 更新时间:2023-12-04 18:01:57 26 4
gpt4 key购买 nike

mahout 中的大多数推荐算法都需要用户-项目偏好。但是我想为给定的项目找到相似的项目。我的系统没有用户输入。即对于任何电影,这些都可以是可用于查找相似系数的属性

  • 类型
  • 主任
  • Actor

    将来可以修改属性列表以构建更高效的系统。但是要在 mahout 数据模型中找到项目相似性,需要用户对每个项目的偏好。这些电影可以聚类在一起,并在给定项目的集群中获得最接近的项目。稍后在引入基于用户的推荐后,上述结果可用于提升结果。

    如果产品属性有一些固定值,如流派。我是否必须将这些值转换为数值。如果是,系统将如何计算两个项目之间的距离,其中 genre-1 和 genre-2 没有任何数字关系。

编辑:

我从命令行中找到了几个示例,但我想在 java 中执行并保存预先计算的值以备后用。

最佳答案

我认为在特征向量的情况下,最好的相似性度量是具有精确匹配的那些,例如 jaccard 相似性。

在jaccard中,两个item向量的相似度计算如下:

相交的特征数/并集的特征数。

因此,将流派转换为数值不会产生影响,因为精确匹配(用于查找交集)在非数值中是相同的。

看看这个问题,了解如何在 mahout 中做到这一点:

Does Mahout provide a way to determine similarity between content (for content-based recommendations)?

关于mahout - 根据项目属性查找相似项目,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33750750/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com