gpt4 book ai didi

algorithm - 测试 2 个字符串 75%+ 相似度的最快算法?

转载 作者:行者123 更新时间:2023-12-04 03:57:23 25 4
gpt4 key购买 nike

<分区>

我需要一个接受 2 个字符串并在它们相似度超过 75% 时返回 bool 值的函数。Levenshtein 有效,但我发现它对于我正在处理的数据量来说太慢了。

如果我能以某种方式首先确定 75% 以上的相似度,我就可以运行 Levenshtein 以进行精确的相似度匹配。

编辑

以下是我所说的相似性的一些例子:

isSimilar75("texts", "txts") //TRUE, 85% similar
isSimilar75("hello world", "hello word") //TRUE, 91% similar
isSimilar75("this is an example of longer text", "this is an example of a longer txt") //TRUE, 92% similar
isSimilar75("this is a test", "test what") //FALSE, 29% similar

该函数计算类似于 levenshtein 的相似度。我只需要一个更简单的 levenshtein 版本,它只根据字符操作(添加、减去和替换字符)的数量返回字符串是否“大约”75% 相似。该函数不需要返回百分比或进行任何精确计算,我只会对从该函数返回 true 的结果运行昂贵的 levenshtein。

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com