- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在实现一个带有标准插入机制的前缀树。如果我们知道我们将得到一个按字母顺序排列的单词列表,是否有任何方法可以更改插入以跳过几个步骤?我正在用 Java 编写代码,尽管我不是在寻找任何特定语言的代码。我考虑过将每个单词的节点添加到队列中,然后向后跳转直到我们到达下一个单词的前缀,但这可能会绕过前缀树的整个点!
对这样的事情有什么想法吗?我发现很难想出一个有用的实现,除非输入是很多非常相似的词 ("aaaaaaaaaab", "aaaaaaaaaac", "aaaaaaaaaad", ...)
或某物。但即便如此,对前缀进行字符串比较的成本也可能与仅正常使用前缀树的成本相似。
最佳答案
您无法避免查看用于构建树的输入字符串中的所有字符。如果有办法做到这一点,那么我可以让你的算法不正确。特别是,假设有一个单词 w 而您没有查看它的其中一个字符(例如,第 k 个字符)。然后,当您的算法运行并尝试将单词放置在 trie 中的某个位置时,它必须能够在不知道所有字符的情况下放置它。因此,如果我将单词的第 k 个字符更改为其他字符,您的算法会将其放在与之前完全相同的位置,这是不正确的,因为单词中的一个字符将不正确。
由于构建 trie 的普通算法所花费的时间与输入中的字符数成正比,如果不采取一些疯狂的技巧(例如并行化构建代码或将字符打包为机器字),您将无法渐近地超越它并用您的 Hammer of Bit Hackery 击打它们。
但是,您可能会获得常数因子加速。由于缓存性能的原因,在链接结构中跟踪大量指针可能会很慢,因此您可以通过最小化必须跟踪的指针数量来加快算法速度。您可以做的一件事是维护您插入的最后一个字符串的末尾位置,以及一个节点列表(最好是动态数组),该列表跟踪路径回到根。要插入新字符,您可以执行以下操作:
这样,如果您插入大量具有合理长度的公共(public)前缀的单词,则可以避免通过结构的共享部分执行大量指针追回。如果你有很多具有相同前缀的词,这可以想象地给你带来性能提升。它并没有比以前更好(事实上,使用了更多的内存),但是不遵循指针所节省的费用可能会增加。我还没有对此进行测试,但它似乎可行。
希望这对您有所帮助!
关于algorithm - 如果我们知道输入是按字母顺序排列的,我们如何优化 trie 的创建?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14283527/
我正在尝试做的事情: 构建一个移动网络应用程序,用户可以在玩拼字游戏时获得帮助找到要玩的单词 用户通过输入任意数量的字母和 0 个或多个通配符来获得单词建议 我是如何尝试做到这一点的: 使用 MySQ
假设我有一个 trie 包含多个字符串的数据结构。要在 trie 中查找字符串,我会从根开始,然后按顺序跟随标有字符串适当字符的指针,直到到达给定节点。 现在假设我想为同一组字符串构建一个“反向 tr
我正在阅读 Ingersoll、Morton 和 Farris 撰写的 Taming Text,但我不明白 solr 的数字 trie 实现如何帮助搜索文本?我对 solr.TrieField fie
我正在阅读 Ingersoll、Morton 和 Farris 的 Taming Text,但我不明白 solr 的数字 trie 实现如何帮助搜索文本?我对 solr 的 solr.TrieFiel
我正在开发一个 Trie 数据结构,其中每个节点代表一个词。所以词 st, stack, stackoverflow 和 overflow 将被排列为 root --st ---stack -----
trie 和radix trie 数据结构是一回事吗? 如果它们不相同,那么 radix trie (AKA Patricia trie) 是什么意思? 最佳答案 基数树是 trie 的压缩版本。在
我用过 video理解前缀特里树(虽然最终我试图最终得到后缀特里树)但是示例代码的链接被破坏所以我从视频中想出了这个,有两个功能,即插入和搜索如下 void insert(string word)
本文关键词:Leetcode, 力扣,Trie, 前缀树,字典树,208,Python, C++, Java 题目地址:https://leetcode.com/problems/implement
这是我使用 trie.c 和 trie.h 制作的主文件。该程序的目的是存储字典文件中的单词。 node* x = (node*)malloc(sizeof(node)); x = insert("b
因此,我必须搜索缺少字母(用于填字游戏)的单词,并且还必须维护剩余空格的可能单词列表。 现在我的问题是,我已经用谷歌搜索了 burst-trie 是否是最快的搜索算法。但是,如果我在 trie 中编写
我正在尝试将这个 trie 实现用于 ocaml:http://www.lri.fr/~filliatr/ftp/ocaml/ds/trie.ml.html 这是我对模块“M”的实现: module
我试图将 trie 中的所有单词放入字符串中,单词由 eow 字段表示,对于 trie 数据结构中的某个字符为 true,因此 trie 可以有字母但没有单词,例如“abc”在 trie 中,但“c”
我不太了解尝试字符串匹配中使用的实际算法。 我想知道为什么似乎更关注字符串匹配的后缀尝试而不是前缀尝试。我们可以不使用前缀尝试来进行子字符串匹配吗?换句话说,后缀尝试相对于前缀尝试有什么优势? 最佳答
当你构建一个特里树时,你是否将字符串/句子存储在其分支的末尾,以便在分支的末尾轻松访问它?有些人这样做,我有时也这样做,但我应该这样做吗? 有时(尤其是使用 LeetCode),我会收到此错误: Li
鉴于以下情况... (def inTree '((1 2) (1 2 3) (1 2 4 5 9) (1 2 4 10 15) (1 2 4 20 25))) 你如何将它转换
我想为高棉语(一种单词之间没有空格的语言)添加一个开源 Java 单词分割程序。开发人员已经很长时间没有开发它了,我无法联系他们了解详细信息(http://sourceforge.net/projec
我有一个字典文件(仅包含小写字母和撇号的单词),它作为特里树加载。 我有一个检查函数,它检查文件中的单词是否存在于特里树中树,无论字母大小写。 一切正常,除了撇号的单词总是拼写错误。 这是我的函数 b
我一直在练习 trie 数据结构(与类(class)作业无关)。此类用于存储字符串的子字符串。对于长度为 n 的字符串,总共有 n(n+1)/2 个子字符串。特别是 trie 的这种实现保留了自然顺序
所以我创建了一个包含大量数据的 trie,我的搜索算法非常快,但我想看看是否有人知道我如何才能让它更快。 bool search (string word) { int wordLen
我正在尝试用 C++ 实现 Trie,但出现运行时错误... 这是我的代码: #include using namespace std; struct trie{ bool word = f
我是一名优秀的程序员,十分优秀!