gpt4 book ai didi

algorithm - 在短文本中查找一组匹配项的高效算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:45:20 26 4
gpt4 key购买 nike

输入:

  1. 相对较短(通常为 100-1000 个字符)的文本。
  2. 预先给出的约 5000 个表达式的固定列表,其中大部分长度为 10-20 个字符,其中一些包含其他表达式作为子表达式(例如“Try”和“Try Again”)。

注意 - 只有第一个输入发生变化,第二个被认为是常量,可用于预处理。

期望的输出:

识别文本中第 2 项中表达式的所有匹配项。如果存在匹配歧义,尽可能采用贪心匹配。

运行时应该相对较快,但没有严格的性能要求。在这里,暴力尝试可能就足够了。

对此有什么好的算法?后缀树在这里有用吗?遍历所有表达式并将它们放入哈希表中怎么样?另请注意,我对实用解决方案很感兴趣,因此易于实现可能比超高效算法更有用...

最佳答案

看看 Aho–Corasick算法。

关于algorithm - 在短文本中查找一组匹配项的高效算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4345573/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com