gpt4 book ai didi

python - 协同过滤中的多重特征——spark

转载 作者:太空宇宙 更新时间:2023-11-03 17:12:48 24 4
gpt4 key购买 nike

我有一个 CSV 文件,如下所示:

customer_ID, location, ....other info..., item-bought, score

我正在尝试在 Spark 中构建协作过滤推荐器。 Spark 获取以下形式的数据:

userID, itemID, value

但我的数据较长,我希望使用所有用户的信息,而不仅仅是userID。我尝试将这些列分组为一列:

(customerID,location,....),itemID,score

但是ALS.train给了我这个错误:

TypeError: int() argument must be a string or a number, not 'tuple'

如何让 Spark 获取多个键/值,而不仅仅是三列?谢谢

最佳答案

对于每个客户,确定您想要用来区分这些用户实体的列。创建一个表(例如在 SQL 中),其中每一行包含一个用户实体的信息,并使用该表中的行号作为用户 ID。

如有必要,对您的项目执行相同的操作,并将这些 ID 提供给您的分类器。

关于python - 协同过滤中的多重特征——spark,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33928602/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com