gpt4 book ai didi

string - 在文本中查找字典字符串的最快方法

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:01:33 24 4
gpt4 key购买 nike

我有一个文本文件和字典。该词典由一个恰好 8 个字符长的单词列表组成。我浏览文本文件并每 8 个字符搜索一次字典(“滑动窗口”)。

目前,我使用python字典数据结构作为查找表。它的摊销查找时间为 0(1),但我想知道是否存在使用问题的特定性质/结构的更快的算法/数据结构。

最佳答案

您可以尝试 aho-corasick 多模式匹配器。它构建了一个有限状态机,使用 trie 和广度优先搜索最长前缀的第一次出现,该前缀也是字典字符串的后缀。您可以在 https://phpahocorasick.codeplex.com 尝试我在 php 中的实现。 .它还增强了搜索通配符的算法。

关于string - 在文本中查找字典字符串的最快方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31560348/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com