validation - Rand 和 Jaccard 相似度指数之间的区别？-6ren

validation - Rand 和 Jaccard 相似度指数之间的区别？

转载作者：行者123 更新时间：2023-12-01 01:27:52

25

4

Rand 和 Jaccard 相似性/验证指数之间的理论区别是什么？

我对方程式不感兴趣，但对它们的差异的解释感兴趣。

我知道 Jaccard 指数会忽略真负值，但为什么呢？这会产生什么样的影响？

谢谢

最佳答案

我在我的计算生物学硕士论文中使用了这些，所以希望我能够以一种可以帮助您的方式回答这个问题-

较短的版本-

J=TP/(TP+FP+FN) 而 R=(TP+TN)/(TP+TN+FP+FN)

当然，根据定义，TN 被 Jaccard 忽略了。对于非常大的数据集，TN 的数量可能非常大，我的论文就是这种情况。因此，该术语插入了所有分析。当我从兰德指数转向杰卡德指数时，我忽略了 TN 的贡献，并且能够更好地理解事物。

较长的版本-

Rand 和 Jaccard 指数比通常的响应特征统计数据(如灵敏度/特异性等)更常用于比较分区/聚类。但它们在某种意义上可以扩展到真阳性或真阴性的概念。让我们更详细地讨论一下-

对于一组元素 S={a1,a2....an}，我们可以定义两个不同的聚类算法 X 和 Y，将它们分成 r 个簇，每个簇 - X1,X2...Xr 簇和 Y1, Y2 ....年集群。组合所有 X 簇或所有 Y 簇，您将再次获得完整的 S 集。

现在，我们定义:-A = S 中 X 中的同一集合和 Y 中的同一集合中的元素对的数量B= S 中 X 中不同集合和 Y 中不同集合的元素对的数量C= S 中 X 中同一集合和 Y 中不同集合的元素对的数量D= S 中 X 中不同集合和 Y 中同一集合的元素对的数量

兰德指数定义为 - R=(A+B)/(A+B+C+D)现在以这种方式看待事物——设 X 是诊断测试的结果，而 Y 是数据点上的实际标签。因此，A、B、C、D 然后减少到 TP、TN、FP、FN(按此顺序)。基本上，R 简化为我在上面给出的定义。

现在，Jaccard Index-

对于两个集合 M,N，Jaccard 索引忽略聚类算法 X 和 Y 中不同集合中的元素，即它忽略 B，这是真正的否定。

J = (A)/(A+C+D) 简化为 J=(TP)/(TP+FP+FN)。

这就是这两个统计数据的根本不同之处。如果您想了解更多关于这些的信息，这里有一篇非常好的论文和一个可能对您有用的网站 -

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.164.6189&rep=rep1&type=pdf

http://clusteval.sdu.dk/313/clustering_quality_measures/542

希望这对您有所帮助!

关于validation - Rand 和 Jaccard 相似度指数之间的区别？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20313870/

25

4

0

文章推荐： jquery - 如何模拟追加回调函数？

文章推荐： javascript - 单击按钮时从内容脚本打开选项页面？

c# - 从私有(private)指数 (d)、公共(public)指数 (e) 和模数 (n) 计算素数 p 和 q
如何根据 e(公钥)、d(私钥)和模数计算 p 和 q 参数？我手边有 BigInteger 键，我可以将粘贴复制到代码中。一个公钥、一个私钥和一个模数。我需要据此计算 RSA 参数 p 和 q。
JavaScript 指数
如何在 JavaScript 中计算指数？比如你会怎么做 12^2？最佳答案 Math.pow() : js> Math.pow(12, 2) 144 关于JavaScript 指数，我们在Sta
数字文字混淆中的 JavaScript 指数
也许是时候喝一杯咖啡了，但我看到了一个我没想到会看到的奇怪问题。我正在阅读 JavaScript The Good Parts，在语法部分我看到以下内容: If a number literal h
java - 实体管理器提交的性能不佳 - 指数
我正在使用带有 eclipse link 2.3 &Derby db 的实体管理器 JPA，并且我有包含 10 个实体的模型，对于每个实体，我需要存储 1000 条记录，此过程大约需要 70 秒。我已
ios - cocoa 指数
我习惯了制作 iPhone 应用程序，但现在我需要制作 Mac 应用程序。因此我必须切换到 Cocoa 框架。有没有类似于 Cocoa 中的 array.index(of: ) 的东西？ iOS 示
python 指数()不工作
我正在尝试在控制台中打印文件名“xyz.0.html”。它吐出一个错误 "substring not found" 目录中的文件: xyz.0.html xyz.1.html xyz.2.html p
计算 h 指数
我需要计算 h-index来 self 存储在树中的出版物列表。我所做的是按递减顺序遍历树，获取引用位置列表看起来像: line 1 10 line 2 5 line 3 4 line 4 0 我
javascript - JS - 幂符号/指数
有没有一种更简单的方法将幂符号/指数符号转换为其等价数字(即从 ⁸ 到 8)，而不仅仅是一堆 replace是吗？编辑:谢谢大家的解决方案! 最佳答案您可以创建一个正则表达式并执行一次 repla
java - 指数 b 中的最后一位数字
我编写这段代码是为了查找指数 b 的最后一位数字，但 SPOJ 说它是错误的。我尝试了几乎所有的测试用例，但找不到错误。问题:http://www.spoj.com/problems/LASTDIG/
css - Z-指数 |我的网站需要帮助
我对 CSS 中的 z-index 有疑问。代码: div.banniere{ background-image:url('../img/banniere.png'); backgr
html - 相对 z 指数？
我有一个弹出的“对话框”小部件，其 z-index 为 100。当我创建另一个弹出窗口( float div)时，它出现在对话框小部件下方，因为我没有明确设置 z -新弹出窗口的索引。结构最终看起来
algorithm - 我不明白如何实现的概率(指数？)推理公式
我正在尝试从一篇学术论文中实现一个真相发现算法。它是一种流式算法，可以实时推断真相和源质量。如果有人有兴趣阅读本文，请在此处了解更多详细信息:http://dl.acm.org/citation.cf
algorithm - 指数 : Little Oh
这个问题在这里已经有了答案: Difference between Big-O and Little-O Notation (5 个答案) 关闭 8 年前。直观上，nb = o(an)(o 是小哦
python - 如何在我的决策树中获取所有 Gini 指数？
我在这里使用 sklearn 制作了一个决策树，在 SciKit learn DL 包下，即。 sklearn.tree.DecisionTreeClassifier().fit(x,y)。如何在每
python - 如何重新计算公共(public)指数？
为了解释这一点，这基本上是一种将浮点向量数据缩小为 8 位或 16 位有符号或无符号整数的方法，该整数具有单个公共(public)无符号指数(最常见的是 bs16 以 11 为常用指数的精度)。我不
algolia - "Join"多个 Algolia 指数？
是否可以在 Algolia 中“加入”索引？获得合并结果？例如: 如果我有两个索引:一个用于“用户”，一个用于“事件”。每个用户都有 id 和 name 属性。每个事件都有 date 和 userI
Pytorch:如何计算用于语义分割的 IoU(Jaccard 指数)
有人可以提供一个关于如何在 pytorch 中为语义分割计算 IoU(交集对联合)的玩具示例吗？最佳答案我在某处找到了它并为我改编了它。如果我能再次找到它，我会发布链接。抱歉，如果这是重复的。这
react-native - NativeBase + 指数 header
我正在将 NativeBase 与指数一起使用。标题位于手机的状态栏下方。您可以在 NativeBase 中看到这一点指数发布的演示。有没有人解决这个问题？最佳答案由于此问题仅在 Android
java - Java 中的 for 循环 - 指数
基本上，有20只羊为一组。当羊群发展到80只羊后，就不再需要有人看管了。每年 t 的羊数量 N 可以通过以下公式找到: N = 220/(1 + 10(0.83)^t) 该程序试图找出羊需要被监管多少
math - SPARQL 中的幂(指数)和其他数学函数支持
我正在尝试编写一个 SPARQL 查询，我想在其中过滤某些内容的平方，但我根本无法弄清楚如何计算数字的平方(x2)(当然，除了将其与自身相乘之外)。我猜想有一个名为 math:sqrt() 的平方根函

首页

博学

6Ren·AI

商城

validation - Rand 和 Jaccard 相似度指数之间的区别？