gpt4 book ai didi

测量无序序列之间距离的算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:43:16 25 4
gpt4 key购买 nike

Levenshtein 距离为我们提供了一种根据无序单个字符计算两个相似字符串之间距离的方法:

quick brown foxquikc brown fax

编辑距离 = 3。

对于具有相似子序列的两个字符串之间的距离,有什么相似算法?例如,在

quickbrownfoxbrownquickfox

Levenshtein 距离为 10,但这没有考虑字符串具有两个相似子序列的事实,这使得它们比完全无序的单词更“相似”

quickbrownfoxqburiocwknfox

然而这个完全无序的版本的编辑距离为 8。

存在哪些考虑子序列长度的距离度量,而不假设子序列可以很容易地分解成不同的词?

最佳答案

我觉得你可以试试shingles或者它们与 Levenshtein 距离的一些组合。

关于测量无序序列之间距离的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2856668/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com