gpt4 book ai didi

java - 相似度得分 - Levenshtein

转载 作者:IT老高 更新时间:2023-10-28 20:50:10 26 4
gpt4 key购买 nike

我用 Java 实现了 Levenshtein 算法,现在我得到了算法所做的更正,也就是成本。这确实有一点帮助,但没有多大帮助,因为我希望将结果作为百分比。

所以我想知道如何计算那些相似点。

我也想知道你们是如何做到的以及为什么这样做。

最佳答案

The Levenshtein distance between two strings is defined as the minimum number of edits needed to transform one string into the other, with the allowable edit operations being insertion, deletion, or substitution of a single character. (Wikipedia)

  • 所以 Levenshtein 距离为 0 意味着:两个字符串相等
  • 最大 Levenshtein 距离(所有字符都不同)为 max(string1.length, string2.length)

因此,如果您需要百分比,则必须使用它来按比例缩放。例如:

“你好”、“你好” -> 列文斯坦距离 1这两个字符串的最大莱文斯坦距离为:5。所以20%的字符不匹配。

String s1 = "Hallo";
String s2 = "Hello";
int lfd = calculateLevensteinDistance(s1, s2);
double ratio = ((double) lfd) / (Math.max(s1.length, s2.length));

关于java - 相似度得分 - Levenshtein,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6087281/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com