- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我有一个很长的字符串。我想找到这个字符串的所有唯一子字符串。我尝试编写使用 set(python) 存储所有子字符串以确保唯一性的代码。对于许多中型和大型字符串,我得到了正确的结果,但是在非常大的字符串的情况下,我得到了 MemoryError。我在 google 上搜索了一下,发现 python 中的 set 数据结构占用了大量 RAM,也许这就是我收到 MemoryError 的原因。
这是我的代码:
a = set()
for i in range(n):
string = raw_input()
j = 1
while True:
for i in xrange(len(string)-j+1):
a.add(string[i:i+j])
if j==len(string): break
j+=1
print sorted(list(a))
对于大字符串有没有办法避免这个错误?或者有人可以建议对我的代码进行更好的修改来处理这个问题吗?
P.S:我没有在 32 位和 64 位版本之间切换的选项。
最佳答案
如果内存中确实需要,那么可以尝试做一个后缀树。尝试不是奇特的数据结构,因此可能有适用于主流语言(如 Python)的良好实现,并且它们可用于实现后缀树。 Marisa-Trie应该获得良好的内存使用率。
关于python - 如何找到一个很长的字符串的所有唯一子串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23766570/
我正在尝试创建一个程序,其中字符串的前三个字符重复给定次数,如下所示: foo('Chocolate', 3) # => 'ChoChoCho' foo('Abc', 3) # => 'AbcAbcA
我有以下字符串: std::string str = "Mode:AAA:val:101:id:A1"; 我想分离一个位于 "val:" 和 ":id" 之间的子字符串,这是我的方法: std::st
DNA 字符串可以是任意长度,包含 5 个字母(A、T、G、C、N)的任意组合。 压缩包含 5 个字母(A、T、G、C、N)的 DNA 字母串的有效方法是什么?不是考虑每个字母表 3 位,我们可以使用
是否有一种使用 levenstein 距离将一个特定字符串与第二个较长字符串中的任何区域进行匹配的好方法? 例子: str1='aaaaa' str2='bbbbbbaabaabbbb' if str
使用 OAuth 并使用以下函数使用我们称为“foo”(实际上是 OAuth token )的字符串加密 key public function encrypt( $text ) { // a
我是一名优秀的程序员,十分优秀!