gpt4 book ai didi

java - 整个单词的 Aho-Corasick 文本匹配?

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:26:24 26 4
gpt4 key购买 nike

我正在使用 Aho-Corasick 文本匹配,想知道是否可以更改它以匹配术语 而不是字符。换句话说,我希望术语成为匹配的基础而不是字符。例如:

搜索查询:“他”,

句子:“Hello world”,

Aho-Corasick 会将“he”匹配到以索引 2 结尾的句子“hello world”,但我宁愿不匹配。所以,我指的是“术语”而不是字符。

最佳答案

执行此操作的一种方法是像往常一样使用 Aho-Corasick,然后执行过滤步骤以消除所有误报。例如,每次找到匹配项时,您都可以确认输入中的下一个和上一个字符是非字母字符,如空格或标点符号。这样,您可以获得 Aho-Corasick 查找的速度,但只考虑在文本中显示为整个单词的匹配项。

希望这对您有所帮助!

关于java - 整个单词的 Aho-Corasick 文本匹配?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14444738/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com