gpt4 book ai didi

php - 模糊文本搜索 : Regex Wildcard Search Generator?

转载 作者:可可西里 更新时间:2023-11-01 00:18:00 24 4
gpt4 key购买 nike

我想知道是否有某种方法可以在 PHP 中进行模糊字符串匹配。在长字符串中寻找单词,即使拼写错误也能找到潜在的匹配项;如果由于 OCR 错误而偏离一个字符,它会找到它的东西。

我在想一个正则表达式生成器也许能够做到这一点。因此,如果输入“crazy”,它将生成此正则表达式:

.*((crazy)|(.+razy)|(c.+azy)|cr.+zy)|(cra.+y)|(craz.+)).*

然后它将返回该词或该词的变体的所有匹配项。

如何构建生成器:我可能会将搜索字符串/单词拆分为一个字符数组,并构建正则表达式,执行 foreach 新创建的数组,用“.+”替换键值(字符串中字母的位置)。

这是进行模糊文本搜索的好方法还是有更好的方法?某种字符串比较根据它的接近程度给我一个分数怎么样?我正在尝试查看一些转换错误的 OCR 文本是否包含一个单词 in short。

最佳答案

当您不知道正确的单词是什么时,字符串距离函数就毫无用处。我建议使用 pspell 函数:

$p = pspell_new("en");
print_r(pspell_suggest($p, "crazzy"));

http://www.php.net/manual/en/function.pspell-suggest.php

关于php - 模糊文本搜索 : Regex Wildcard Search Generator?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1720660/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com