gpt4 book ai didi

apache-spark - 如何对 Spark MatrixFactorizationModel 中的所有用户产品组合进行评分?

转载 作者:行者123 更新时间:2023-12-04 12:20:42 24 4
gpt4 key购买 nike

给定一个 MatrixFactorizationModel返回完整的用户产品预测矩阵的最有效方法是什么(实际上,通过某个阈值过滤以保持稀疏性)?

通过当前的 API,曾经可以将用户产品的笛卡尔积传递给 predict 函数,但在我看来,这会做很多额外的处理。

访问私有(private) userFeatures、productFeatures 是否是正确的方法,如果是这样,是否有一种好方法可以利用框架的其他方面以有效的方式分配此计算?具体来说,有没有比“手动”乘以所有对 userFeature、productFeature 更好的简单方法?

最佳答案

Spark 1.1 有一个 recommendProducts可以映射到每个用户 ID 的方法。这总比没有好,但并未真正针对推荐给所有用户进行优化。

我会仔细检查您是否真的打算为每个人提出建议;在规模上,这本质上是一个非常缓慢的操作。考虑仅针对最近活跃的用户进行预测。

否则,是的,您最好的选择是创建自己的方法。特征 RDD 的笛卡尔连接可能太慢了,因为它洗牌了很多特征向量的副本。选择较大的用户/产品功能集,并将其映射。在每个工作人员中,将其他产品/用户功能集保存在每个工作人员的内存中。如果这不可行,您可以使其更复杂,并多次映射内存中较小 RDD 的子集。

关于apache-spark - 如何对 Spark MatrixFactorizationModel 中的所有用户产品组合进行评分?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26326703/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com