gpt4 book ai didi

similarity - 为什么 LogLikelihoodSimilarity 函数对于 0 和 1 的数据集返回大于 1.0 的值?

转载 作者:行者123 更新时间:2023-12-03 19:44:10 24 4
gpt4 key购买 nike

我有一个表示为 1.0 的大型偏好数据集,我正在使用 Tanimoto 相似度函数以及通用 bool 用户和项目偏好推荐器。建议值通常介于 0 和 1.0 之间。

许多来源,例如 Mahout in Action 一书和 this prior SO thread为 bool 数据集推荐 LogLikelihoodSimilarity 指标而不是 Tanimoto。当我切换到 LogLikelihood Similarity 指标时,它生成了一些范围更高的分数,例如 11。我不得不回到 Tanimoto 以获得更合理的评分。您能提出任何可能的修复建议,还是我误解了推荐项目分数的返回值?

最佳答案

在没有评级的情况下,您观察到的值不是预测评级。毕竟都是1.0,不能用来排名。结果实际上是相似性的总和,这就是它可以任意大的原因。它不应该在 [0,1] 或类似的范围内。

关于similarity - 为什么 LogLikelihoodSimilarity 函数对于 0 和 1 的数据集返回大于 1.0 的值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10179018/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com