algorithm - Kendall 距离和 Kendall tau 距离有什么区别？-6ren

algorithm - Kendall 距离和 Kendall tau 距离有什么区别？

转载作者：塔克拉玛干更新时间：2023-11-03 06:38:32

24

4

我现在正尝试使用 Kendall 的距离来改进基于 Borda 计数方法的排名集。

我被要求遵循特定文档的说明。在文档中指出:

“Kendall 距离将来自两个排名的项目之间的成对差异计算为:

在哪里

Kendall 距离由其最大值 C2n 归一化。肯德尔距离越小，排名之间的相似度越大。

Kendall's tau 是另一种衡量排名之间相似度的方法，容易与Kendall's distance 混淆。Kendall 的 tau 定义为:

Kendall 的 tau 是根据归一化的 Kendall 距离定义的。请注意，Kendall's tau 越大，则比较排名之间的相似度越大。在本文中，我们使用肯德尔距离而不是肯德尔 tau 距离。”

我的目标是通过使用 Kendall 的距离来提高以下排名:

    x1 x2 x3 x4
A1  4  1  3  2
A2  4  1  3  2
A3  4  3  2  1
A4  1  4  3  2
A5  1  2  4  3

在这个排名中，第i行代表根据Ai得到的排名，每一列代表相应item在每个排名中的排名位置。 (即xn代表待排序的item，Ai代表对item进行排序的人。)

尽管有文档的解释，我还是不明白这两个距离之间有什么区别。 sigma 符号下方的“(j,s), j != s”代表什么？最后，如何在上面提供的排名中实现 Kendall 的距离？

最佳答案

距离和相似度是两个相关的概念，但对于距离而言，完全相同意味着距离为0，随着事物越来越不同，它们之间的距离越来越大，没有非常明显的固定界限。良好的距离将遵守度量规则 - 请参阅 https://en.wikipedia.org/wiki/Metric_(mathematics) .对于相似度，精确恒等表示相似度为 1，相似度随着事物变大而降低，但通常不会降低到 0 以下。Kendall 的 tau 似乎是将 Kendall 的距离转化为相似度的一种方式。

"(j,s), j != s"表示考虑 j 和 s 的所有可能性，除了那些 j = s 的可能性。

您可以通过简单地对 j 不等于 s 的所有可能性求和来计算 Kendall 的距离 - 但这样做所花费的时间与项目数量的平方成正比。有一些方法可以使花费的时间仅上升为 n * log(n)，其中 n 是项目的数量 - 关于这个和 Kendall 上的许多其他内容，请参见 https://en.wikipedia.org/wiki/Kendall_rank_correlation_coefficient

关于algorithm - Kendall 距离和 Kendall tau 距离有什么区别？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54603078/

24

4

0

文章推荐： algorithm - 将三角形放在一条线上，最小化最大距离

文章推荐： algorithm - 如何将以下递归转换为自上而下的动态规划？

文章推荐： php - 平均分配奖杯

文章推荐： algorithm - 使用基于决策树比较的模型证明下限

r - R 中的关联度量——Kendall 的 tau-b 和 tau-c
是否有任何 R 包用于计算 Kendall 的 tau-b 和 tau-c 及其相关的标准误差？我在 Google 和 Rseek 上的搜索一无所获，但肯定有人在 R 中实现了这些。最佳答案今天偶
java - Tau 数算法
我正在尝试制作一个程序，让用户输入 2 个数字，然后该程序会在此间隙中给出 tau 数字。 “头”数是除以它的除数总数的数。例如(1,2,3,4,6,8,12,24)所有这些数都可以整除24。有8个数
javascript - Tau-Prolog 结果在浏览器窗口中可见
我对 Tau-Prolog 和 Javascript 还很陌生。一开始我想在浏览器中展示一些由 Tau-Prolog 引擎计算的结果。到目前为止，我只想显示我的 Prolog 数据库中包含的一些信息
javascript - Tau Prolog 的行为与沙箱不同
问题:在 Tau Prolog 在线解释器中完美运行的程序在本地计算机上执行时表现不同。 [使用 HTML 和 Javascript] 错误已追溯到 Prolog 中使用的 if、else if、el
algorithm - 计算两个整数序列之间的 Kendall Tau 距离的快速算法
这个问题在这里已经有了答案: Kendall tau distance (a.k.a bubble-sort distance) between permutations in base R (3
prolog - 如何将动态谓词的更改永久保存到 .pl 文件？ (Tau 序言)
问题 - 断言的动态谓词不会永久保存，在创建新 session 后它们丢失了。如何永久保存它们？我正在使用 Tau Prolog:JavaScript 中的 Prolog 解释器。我正在加载序言代
algorithm - Kendall 距离和 Kendall tau 距离有什么区别？
我现在正尝试使用 Kendall 的距离来改进基于 Borda 计数方法的排名集。我被要求遵循特定文档的说明。在文档中指出: “Kendall 距离将来自两个排名的项目之间的成对差异计算为: 在哪里
javascript - Tau-Prolog 解释器表现出与 SWI-Prolog 不同的行为
我目前正在尝试在 Tau-Prolog 中实现一些基本的 Prolog 查询。虽然我在 SWI-Prolog 中有工作查询，但我无法实现它们以在 Tau-Prolog 中工作。我想返回数据库中具有接口
javascript - 在 Node.js 中使用 Tau-Prolog
下载 Tau-Prolog 后，我尝试运行 this example ，但我突然停了下来: $ nodejs ./sample.js bread/home/stefan/Desktop/tau-pro
javascript - 在其他任何事情之前使用 await 和 async 来加载解析 Tau-Prolog
我的任务是在执行任何其他操作之前在浏览器中加载和解析 Tau-Prolog 代码。我试过这种方法(webProlog.pl 包含 Tau-Prolog 代码): var session = pl.cr
r - 基 R 中排列之间的 Kendall tau 距离(又名冒泡排序距离)
如何在不加载额外库的情况下在 R 中计算两个排列之间的 Kendall tau 距离(又名冒泡排序距离)？最佳答案这是一个 O(n.log(n)) 的实现，在阅读后拼凑而成，但我怀疑可能有更好的
javascript - 使用 TAU 库在 Tizen Web App 中解析 JSON
有没有一种简单的方法可以使用 TAU 库解析 JSON？我找不到任何解决方案。我正在尝试从 alphavantage api 获取数据并显示它:www.alphavantage.co/query?f
python - 使用 scipy 和 groupby 计算 Kendall 的 tau
我有一个 csv 文件，其中包含每年和每个气象站的降水数据。它看起来像这样: station_id year Sum 210018 1916 65.024 2
bayesian - pymc MAP警告: Stochastic tau's value is neither numerical nor array with floating-point dtype.推荐拟合方法fmin(默认)
我在这里看过类似的问题 pymc warning: value is neither numerical nor array with floating-point dtype 但没有答案，有人可以告

首页

博学

6Ren·AI

商城

algorithm - Kendall 距离和 Kendall tau 距离有什么区别？