similarity - 为什么 LogLikelihoodSimilarity 函数对于 0 和 1 的数据集返回大于 1.0 的值？-6ren

similarity - 为什么 LogLikelihoodSimilarity 函数对于 0 和 1 的数据集返回大于 1.0 的值？

转载作者：行者123 更新时间：2023-12-03 19:44:10

24

4

我有一个表示为 1.0 的大型偏好数据集，我正在使用 Tanimoto 相似度函数以及通用 bool 用户和项目偏好推荐器。建议值通常介于 0 和 1.0 之间。

许多来源，例如 Mahout in Action 一书和 this prior SO thread为 bool 数据集推荐 LogLikelihoodSimilarity 指标而不是 Tanimoto。当我切换到 LogLikelihood Similarity 指标时，它生成了一些范围更高的分数，例如 11。我不得不回到 Tanimoto 以获得更合理的评分。您能提出任何可能的修复建议，还是我误解了推荐项目分数的返回值？

最佳答案

在没有评级的情况下，您观察到的值不是预测评级。毕竟都是1.0，不能用来排名。结果实际上是相似性的总和，这就是它可以任意大的原因。它不应该在 [0,1] 或类似的范围内。

关于similarity - 为什么 LogLikelihoodSimilarity 函数对于 0 和 1 的数据集返回大于 1.0 的值？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10179018/

24

4

0

文章推荐： sqlite - Titanium JS:尝试应用数据库迁移时出错

文章推荐： google-maps - 相当于 Google Map "idle"事件的传单 map 事件

python - 如何使用 gensim.similarities.Similarity 找到两个句子之间的相似性
我想编写代码来查找两个句子之间的相似性，然后我最终使用 nltk 和 gensim 编写了这段代码。我使用标记化和 gensim.similarities.Similarity 来完成这项工作。但这不
java AES/CFB/NoPadding :when encrypting similar data the results are similar too
package com.game; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax
python - word2vec_basic 输出 : trying to test word similarity versus human similarity scores
作为熟悉 Tensorflow 的一种方式，我正在尝试验证 word2vec_basic.py(请参阅 tutorial)生成的词嵌入在对照人类相似性分数进行检查时是否有意义。然而，结果出人意料地令人
sql - 什么更好 : to have many similar databases or one database with similar tables or one database with one table?
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 9 年前。 Improve this qu
similarity - 如何标准化编辑距离以获得最大对齐长度而不是字符串长度？
问题:一些 R 包具有 Levenshtein 距离实现，用于计算两个字符串的相似度，例如http://finzi.psych.upenn.edu/R/library/RecordLinkage/ht
similarity - 如何衡量两个系列数据之间的相似性？
我需要找到两个数据数组之间的相似性度量。您可以将相似性度量称为任何您想要的名称，差异、相关性或任何其他名称。例如: 1, 2, 3, 4, 5 < Series 1 2, 3, 4, 5, 6
similarity - PIL 逊相关相似度和调整余弦相似度有什么区别？
虽然它们非常相似，但我确信 Pearson 相关相似度和调整余弦相似度之间存在一些差异，因为所有的论文和网页都将它们分为两种不同的类型。然而，它们都没有提供明确的定义。 Here是其中一页。谁能说
python - 如何在gensim中使用similarities.Similarity？
如何使用similarities.gensim中的Similarity 因为如果我使用 similarities.MatrixSimilarity: index = similarities.Matr
python搜索技术: word similarity
我想得到两个词的相似度百分比，eg) abcd versus zzabcdzz == 50% similarity 不需要非常准确。有什么办法吗？我正在使用 python，但可以随意推荐其他语言。最
734. Sentence Similarity 句子相似性
题目地址：https://leetcode-cn.com/problems/sentence-similarity/ 题目描述 Given two sentences words1, words2
R:搜索字符串 SIMILAR 并返回条件符号
我的 df 有以下条目: A xxx xxx xxx1 xx1x yyyy gggg 我想根据以下条件，根据 A 列的相似性将符号添加到我的 df 的 B 列。我将阈值设置为 = 或 > 75% 相
cosine-similarity - word2vec，求和还是平均词嵌入？
我正在使用word2vec来表示一个小词组(3至4个单词)作为唯一矢量，方法是将每个单词嵌入相加或计算单词嵌入的平均值。通过实验，我总是得到相同的余弦相似度。我怀疑这与在训练后将word2vec生成
similarity - 如何实现 "related articles?"
我如何编写代码来查找与用户当前正在阅读的文章相关(相似)的文章？例如，假设我有文章: Python programming tips Python programming for newbies P
similarity - 使用余弦相似度测量的 n 元句子相似度
我一直在从事一个关于句子相似度的项目。我知道它已经被问过很多次了，但我只是想知道我的问题是否可以通过我正在做的方式使用的方法来完成，或者我应该改变我解决问题的方法。粗略地说，系统应该分割一篇文章的所有
java - 如何在HashMap中只获取一个键为 "similar"的键
我有一个由字符串主机名和列表服务列表定义的对象“ObjectName”。两个 serviceList 可能包含一个或多个相同的字符串。每个字符串都是一个方法的名称。不能有相同名称的方法执行不同的操
java - 在jpql中使用 "similar to"或 "~*"
我在 playframework 2.2 中使用 postgresql 和 jpa。我正在尝试在我的JPQL中使用like with in，方法是使用类似于类似this的东西。线程。 select
similarity - RGBA 颜色空间中的颜色相似度/距离
如何计算 RGBA 颜色空间中两种颜色之间的相似度？(背景颜色当然未知) 我需要通过查找图像中每个像素的最佳调色板条目*，将 RGBA 图像重新映射到 RGBA 颜色调色板。在 RGB 颜色空间中，
Java : Get the most similar string
需要您的另一个提示: 我有一个包含系统路径的列表: C:\System\local\something\anything C:\System\local\anywhere\somewhere C:\S
Android::为 'similar' 屏幕提供资源
我的应用程序布局有点棘手，所以主要问题是支持不同的屏幕。让我们以两部手机 HTC Sensation (4.3"960x540 256dpi) 和 Droid (3.7"854x480 265dpi)
android - 如何在android : similar to email中选择附件
我有一个应用程序。它不是电子邮件应用程序。但它具有类似于电子邮件的功能，用户可以选择在发送消息的同时发送附件。例如，当我在我的 gmail 上单击添加附件时，我可以选择附加任何内容，例如视频、音乐、图

首页

博学

6Ren·AI

商城

similarity - 为什么 LogLikelihoodSimilarity 函数对于 0 和 1 的数据集返回大于 1.0 的值？