gpt4 book ai didi

binary-data - 二元推荐算法

转载 作者:行者123 更新时间:2023-12-01 03:38:30 24 4
gpt4 key购买 nike

我目前正在为一项学校作业做一些研究。我有两个数据流,一个是用户评分,另一个是网店的搜索、点击和订单历史(二进制数据)。

我发现如果您使用评级数据,协同过滤是最好的算法系列。我发现并研究了这些算法:

基于内存

  • 基于用户
  • 皮尔逊相关系数
  • 受限皮尔森
  • 向量相似度(余弦)
  • 均方差
  • 加权皮尔逊
  • 相关阈值
  • 最大邻居数
  • 相关性加权
  • Z-score 归一化
  • 基于项目
  • 调整余弦
  • 最大邻居数
  • 相似融合

  • 基于模型
  • 基于回归
  • 斜坡一
  • lsi/svd
  • 正则化 svd (rsvd/rsvd2/nsvd2/svd++)
  • 基于集成邻居
  • 基于聚类的平滑

  • 现在我正在寻找一种使用二进制数据的方法,但我很难弄清楚是否可以使用二进制数据而不是这些算法的评级数据,或者是否有不同的算法系列我应该看着 ?

    我提前为拼写错误道歉,因为我有阅读障碍并且不是本地作家。感谢 marc_s 的帮助。

    最佳答案

    看看数据挖掘算法,例如关联规则挖掘(又名购物篮分析)。你在推荐系统中遇到了一个棘手的问题:一元和二元数据很常见,但最好的个性化算法却不能很好地处理它们。评分数据可以代表单个用户-项目对的偏好;例如,我给这部电影打了 4 星(满分 5 星)。但是对于二进制数据,我们有最细粒度的评分数据类型:我喜欢或不喜欢某样东西,或者吃过或没吃过。注意不要混淆二进制和一元数据:一元数据意味着你有用户消费某些东西的信息(编码为 1,很像二进制数据),但你没有关于用户是不喜欢还是不消费的信息某物(编码为 NULL 而不是二进制数据的 0)。例如,您可能知道一个人浏览了 10 个网页,但您不知道如果她知道其他网页可用,她会怎么想。那是一元数据。您不能从 NULL 假设任何偏好信息。

    关于binary-data - 二元推荐算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32623809/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com