wordnet - 基于 WordNet 相似度的最高分-6ren

wordnet - 基于 WordNet 相似度的最高分

转载作者：行者123 更新时间：2023-12-02 17:02:58

25

4

一些相似度得分介于 0 和 1 之间，例如最短路径和 WuP。因此汽车与汽车之间的相似度将为 1，但 LCh 等其他度量将为

lch( car, automobile ) = 3.6889

我想知道这些措施的最高分。 3.6889 被认为是最大值吗？这些是否意味着 LCH 分数在 0 到 3.6889 之间。

我补充以下措施

jcn( car, automobile ) = 12876699.5
res( car, automobile ) = 9.3679
lesk( car, automobile ) = 9519

最佳答案

似乎 3.6375861597263857 是 lch_similarity 的最大值(我无法得到 3.6889...)。 lch_similarity，根据the documentation具有以下属性:

Leacock Chodorow Similarity:
        Return a score denoting how similar two word senses are, based on the
        shortest path that connects the senses (as above) and the maximum depth
        of the taxonomy in which the senses occur. The relationship is given as
        -log(p/2d) where p is the shortest path length and d is the taxonomy
        depth.
...
:return: A score denoting the similarity of the two ``Synset`` objects,
            normally greater than 0. None is returned if no connecting path
            could be found. If a ``Synset`` is compared with itself, the
            maximum score is returned, which varies depending on the taxonomy
            depth.

鉴于 rock_hind.n.01 位于 WordNet 分类中的最深级别 (19)，而 change.n.06 位于最浅级别 (2 )，我们可以尝试不同的深度:

>>> from nltk.corpus import wordnet as wn
>>> rock = wn.synset('rock_hind.n.01')
>>> change = wn.synset('change.n.06')
>>> rock.lch_similarity(rock)
3.6375861597263857
>>> change.lch_similarity(change)
3.6375861597263857
>>> change.lch_similarity(rock)
0.7472144018302211
>>> rock.lch_similarity(change)
0.7472144018302211

可以对其他度量进行类似的实验，其中范围似乎要大一些:

>>> from nltk.corpus import wordnet_ic, genesis
>>> brown_ic = wordnet_ic.ic('ic-brown.dat')
>>> semcor_ic = wordnet_ic.ic('ic-semcor.dat')
>>> genesis_ic = wn.ic(genesis, False, 0.0)
>>> rock.res_similarity(rock, brown_ic) # res_similarity, brown
1e+300
>>> rock.res_similarity(change, brown_ic)
-0.0
>>> rock.res_similarity(rock, semcor_ic) # res_similarity, semcor
1e+300
>>> rock.res_similarity(change, semcor_ic)
-0.0
>>> rock.res_similarity(rock, genesis_ic) # res_similarity, genesis
1e+300
>>> rock.res_similarity(change, genesis_ic)
-0.08306855877006339
>>> change.res_similarity(rock, genesis_ic)
-0.08306855877006339
>>> rock.jcn_similarity(rock, brown_ic) # jcn, brown - results are identical with semcor and genesis
1e+300
>>> rock.jcn_similarity(change, brown_ic)
1e-300
>>> change.jcn_similarity(rock, brown_ic)
1e-300

关于wordnet - 基于 WordNet 相似度的最高分，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20112828/

25

4

0

文章推荐： distinct - 如何使用 arel/关系代数获取不同的值

文章推荐： msbuild - TeamCity:无法检测 MSBuild 项目中的目标

文章推荐： asp.net - 使用公式中的字符串创建计算列

文章推荐： reactjs - 从react.js源代码生成序列图的工具

css - 如何在不同设备范围内使图标的物理尺寸相同/相似？
我遇到了一个让我非常难过的问题。但现在看来这一定是一个普遍的问题，我很惊讶我找不到关于它的另一个问题。基本上，我的网站上会出现一些图标。我希望它们在每台设备上都显示出大致相同的大小——大致是可触摸的
java - 还有哪一种编程语言与 Java 相似？
我是一名 Java 专业人士。现在我喜欢转向其他编程语言。谁能建议我哪种编程语言更容易消化，并且该语言具有 Web 开发功能。我对 Web 开发感兴趣。最佳答案 C# - 网络开发非常好(只需看看这
javascript - 相似 URL 的正则表达式模式匹配
我需要为不同的 url 发送不同的响应。但是我正在使用的正则表达式不起作用。有问题的两个正则表达式是 "/v1/users/[^/]+/permissions/domain/HTTP/" (例
postgresql - 在数据库中搜索(相似)字符串的可扩展方式
让我描述一下我的问题。有一个输入字符串和一个包含数千个字符串的表。我正在寻找搜索与输入字符串最相似* 字符串的最佳方法。搜索应该返回一个包含 ~10 个建议字符串的列表，按相似度排序。字符串在数据库中
php - 地穴为两个不同(相似)的密码返回相同的哈希值
我在使用 crypt() 时遇到问题，如果用户有密码(本例中为 password1)，并且他们将其更改为 password2，则散列会返回相同的结果。您可以在此处进行测试:旧链接输入 password
xml - 有没有其他语言在目的上与 XML 相似？
我问这个是因为我发现 XML 在视觉上没有吸引力。我知道 XML 非常有名，很有用，而且它被大多数(如果不是全部)程序员接受为一种非常有用的定义和结构化数据的语言；然而，我真的不觉得盯着它看、看着它或
mathematical-optimization - 分配分配(线性规划)相似
我有工作需要在 14 天内完成。我有5名 worker 。一天正好需要3个 worker 。每个 worker 最多只能工作 9 天。每个 worker 都有自己的日期偏好，每个 worker 每天都
c# - 就垃圾回收而言，线程是否与 FileStreams 相似？
FileStream 或 DB 句柄类型的对象必须正确关闭，因为它在内部使用 Windows 句柄。同样，Threads 也使用 Windows 句柄吧？线程是否有一些内部机制来释放那些 Window
css - 如何选择所有单元格和相似
如果这是非常基本的，请原谅。我一直在尝试遍历行数组中的每个单元格包括标题单元格。我可以在 Nokogiri CSS 选择器中使用 OR 运算符吗？ thang= Nokogiri::HTML(IO.r
javafx - 如何使 RichTextFx 的外观和感觉与 TextArea 相似？
默认情况下，RichTextFx(顶部控件)看起来不像 TextArea(底部控件): 我找到了一种添加圆角的方法(只需从 modena.css 复制并配置 some styles): .virtua
nim-lang - Nim 在内存效率低下是否与 Java 相似？
在 64 位 Java 中，每个对象实例往往包含一个 192-bit header , 包含类指针，标志和锁(每个 64 位)。这可能会导致小对象的大量内存开销。尼姆的情况是否类似？用两种语
ios - 需要有关为 iOS 应用程序实现多个(相似)场景的建议
我正在开发一个具有多个功能(通过 tableview 选择)的应用程序，这些功能几乎都做同样的事情，相似的布局、相似的按钮、相似的输入字段等等。但在我相信它们自己的地方有足够的不同类(class)。每
800. Similar RGB Color 相似 RGB 颜色
题目地址：https://leetcode-cn.com/problems/similar-rgb-color/ 题目描述 Inthe following, every capital lette
r - 什么与 R 中的 #ifdef DEBUG 相似？
我正在编写 R 代码，我希望它在“非调试”或“调试”模式下运行。在 Debug模式下，我希望代码打印出运行时信息。在其他语言中，我通常会有某种打印功能，除非打开标志(用于编译或运行时)，否则什么都不
javascript - 为什么 `var a= function(){}` 在以下情况下与 `function a(){}` 相似？
我不明白这个OP接受的答案的一部分: Javascript function scoping and hoisting 作者说: " 此外，在这种情况下， function a() {} 行为与相同
c - 尽管 block 相似，bcmp() 返回 1
我正在做一个bcmp(&v6_addr1,&v6_addr2,sizeof(v6_addr1)) (gdb) p v6_addr2 $15 = {u = {b = "0\001", '\000' ,
python - tkinter Canvas 方法与 Text .see() 相似
我有一个充满按钮的 Canvas，我将其 ID 存储在字典中。 Canvas 很长，带有垂直滚动条。有一种方法可以自动将 View 定位在给定的按钮上吗？当使用 Text 时，txt.see(pos
python - 使用 Python/PIL 比较(相似)图像
我正在尝试使用 Python 2.6 和 PIL 计算两个图像的相似度(读作:Levenshtein 距离)。我打算给我们e python-levenshtein用于快速比较的库。主要问题: 什么
php - php 中的 "->"是否与 javascript 中的 "."相似(也称为等效)？
换句话说，php $object->method(); 和 $object->property = 'someValue'; 相当于，js: $object.method(); 和 $object.p
python - 为什么 tuple.index() 的性能与 list.index() 相似？
我写了一个简单的函数，它接收实现 .index() 的东西和要检查的字符列表。我的假设是，由于字符串和元组都是不可变的，因此它们具有相似的性能(或者至少，元组的性能优于列表)。相反，元组似乎等同于列

首页

博学

6Ren·AI

商城

wordnet - 基于 WordNet 相似度的最高分