- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
假设,它有一个字符串数组 D
。给定一个字符串 Q
,我想在 D
中找到与 Q
具有最长公共(public)前缀的字符串。
我不想要复杂的数据结构,但它仍然应该比线性扫描更快。
有没有一种解决方案可以巧妙地对 D
进行排序,并且只进行一次二分查找?
谢谢!
编辑
澄清:当然,如果只做一次,单次扫描比排序快。但是,我需要在固定的 D
上做很多这样的查找,所以这就是我寻找预先计算的数据结构的原因。
最佳答案
根据D
中的字符创建一棵树:
每个节点
包含字符
和一个子节点
列表。
例如,如果 D
是
a
ab
ac
ace
d
然后
a
和 d
d
没有 child a
有 2 个 child - b
和 c
b
没有 child c
有 1 个 child - e
e
没有 child 查找(并添加到树中!)基本上是遍历节点,直到没有匹配的子节点为止。
例如,假设 Q=af
。有一个包含 Q[0]=a
的顶级节点,但它没有包含 Q[1]=f
的子节点,所以最长的前缀是 a
。 a
节点的所有子节点表示 D
中的字符串,这些字符串与 Q
具有最长的公共(public)前缀,特别是 a
, ab
, ac
, ace
.
查找和添加操作在字符串长度上都是线性的,因此结构的创建需要 O(sum(len(x) for x in D))
时间,查找是 O( len(Q))
.
关于javascript - 搜索最长前缀,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42808272/
我正在尝试编写一个名为 map-longest 的 Clojure 实用函数(感谢备用名称建议)。该函数将具有以下“签名”: (map-longest fun missing-value-seq c1
为什么我创建了一个重复的线程 我在阅读后创建了这个线程 Longest increasing subsequence with K exceptions allowed .我意识到提出问题的人并没有真
我正在编写一个 Sub 来识别 1 到 1000 之间最长的 Collatzs 序列。由于我刚刚开始学习 VBA,我想知道如何添加过程来计算每个序列的长度。 Sub Collatz() Dim i
我正在编写一个 Sub 来识别 1 到 1000 之间最长的 Collatzs 序列。由于我刚刚开始学习 VBA,我想知道如何添加过程来计算每个序列的长度。 Sub Collatz() Dim i
我正在尝试减去 CSV 中的两列以创建第三列“持续时间”结束时间 - 开始时间 每一行也对应一个用户 ID。 我可以创建一个仅包含“持续时间”列的 csv 文件,但我宁愿将其重定向回原始 csv。 例
我在 2018.04 玩这个最长的 token 匹配,但我认为最长的 token 不匹配: say 'aaaaaaaaa' ~~ m/ | a+? | a+ /; # 「a」
因此,按照规范规定最终用户/应用程序提供的给定变量(200 字节)的字节长度。 使用 python 字符串,字符串的最大字符长度是多少,满足 200 字节,因此我可以指定我的数据库字段的 max_le
我需要针对我们的Jenkins构建集群生成每周报告。报告之一是显示具有最长构建时间的作业列表。 我能想到的解决方案是解析每个从属服务器(也是主服务器)上的“构建历史”页面,对于作业的每个构建,都解析该
我正在构建一个 iOS 应用程序,它将流式传输最长为 15 秒的视频。我阅读了有关 HLS 的好文章,因此我一直在对片段大小为 5 秒的视频进行转码。如果视频的第一部分加载时间太长,那么我们可以在接下
docs for Perl 6 longest alternation in regexes punt to Synopsis 5记录 longest token matching 的规则.如果不同的
我是一名优秀的程序员,十分优秀!