gpt4 book ai didi

apache-spark - 基于内容的大规模推荐

转载 作者:行者123 更新时间:2023-12-04 03:58:31 26 4
gpt4 key购买 nike

这个问题可能在博客和问答网站中被多次重复,但我还没有找到任何具体的答案。

我正在尝试仅使用他们的购买历史为客户构建一个推荐系统。

  • 假设我的应用程序有 n 个产品。
  • 根据属性(如国家、类型、价格)计算所有 n 个产品的项目相似性
  • 当用户需要推荐时 - 为用户 u 循环之前购买的产品 p 并获取相似的产品(相似在上一步中完成)

  • 如果是对的,我们称之为基于内容的推荐而不是协同过滤,因为它不涉及项目的共同出现或用户对项目的偏好。

    我的问题是多方面的:
  • 是否有任何现有的可扩展 ML 平台可以解决基于竞争的推荐(我可以采用不同的技术/语言)
  • 有没有办法调整 Mahout 以获得这个结果?
  • 分类是一种处理基于内容的推荐的方法吗?
  • 它是图数据库擅长解决的问题吗?

  • 注意:我查看了 Mahout(因为我熟悉 Java 并且 Mahout 显然利用 Hadoop 进行分布式处理)以规模和优势来实现这一点,因为它具有经过良好测试的 ML 算法。

    感谢您的帮助。任何例子都会很棒。谢谢。

    最佳答案

    所谓的元素-元素推荐器是预先计算相似性的自然候选者,因为元素的属性很少改变。我建议您预先计算每个项目之间的项目相似度,并可能存储每个项目的前 K 个,如果您有足够的资源,您可以将相似度矩阵加载到主内存中以进行实时推荐。

    查看我对这个问题的回答,了解在 Mahout 中执行此操作的方法:Does Mahout provide a way to determine similarity between content (for content-based recommendations)?

    该示例是如何计算项目之间的文本相似度,然后将预先计算的值加载到主内存中。

    有关保存值的不同数据结构的性能比较,请查看以下问题:Mahout precomputed Item-item similarity - slow recommendation

    关于apache-spark - 基于内容的大规模推荐,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29832812/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com