gpt4 book ai didi

字符串相似度 -> Levenshtein 距离

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:16:08 27 4
gpt4 key购买 nike

我正在使用 Levenshtein 算法来查找两个字符串之间的相似性。这是我正在制作的程序的一个非常重要的部分,因此它需要有效。问题是该算法没有发现以下示例相似:

CONAIR
AIRCON

算法给出的距离为 6。所以对于这个 6 个字母的单词(你看字母数量最多的单词),差异为 100% => 相似度为 0%。

我需要找到一种方法来找出两个字符串之间的相似性,同时还要考虑像我之前介绍的那种情况。

我可以使用更好的算法吗?或者你们推荐我什么?

编辑:我还研究了“Damerau–Levenshtein”算法,它添加了换位。问题是这种换位仅适用于相邻字符(而不适用于多个字符)。

最佳答案

我会将术语分为一元组、二元组和三元组,然后计算余弦相似度。

关于字符串相似度 -> Levenshtein 距离,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11675034/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com