- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一本包含约 150,000 个键的字典。没有重复的键。每个 key 的长度为 127 个字符,每个 key 在 1-11 个位置上有所不同(大多数差异发生在 key 的末尾)。每个键的值是一个唯一的 ID 和一个空白列表 []。对于一个给定的键,我想找到所有其他恰好相差 1 个字符的键,然后将 ID 附加到给定的键空白列表中。最后我想要一个键和它的值(一个 ID 和一个包含一个字符不同的所有键的列表)。
我的代码可以工作,但问题是它太慢了。双 for 循环是 150,000^2 = ~250 亿。在我的电脑上,我每分钟可以执行约 200 万次循环(每次都执行 match1 函数)。这将需要大约 8 天的时间才能完成。没有 match1 函数的循环运行速度快约 7 倍,因此将在约 1 天内完成。
我想知道是否有人知道如何提高速度?
# example dictionary
dict = {'key1' : ['1', []], 'key2' : ['2', []], ... , 'key150000' : ['150000', []]}
def match1(s1,s2,dict):
s = 0
for c1, c2 in zip(reversed(s1), reversed(s2)):
if s < 2:
if c1 != c2:
s = s + 1
else:
break
if s == 1:
dict1[s1][1].append(dict1[s2][0])
for s1 in dict:
for s2 in dict:
match1(s1,s2,dict)
最佳答案
目前您正在检查每个键与其他每个键的总 O(n^2)
比较。洞察力是我们只需要检查其他 key 的一小部分。
假设每个键的字符具有 k
不同值的字母表。例如,如果您的 key 是由 a-z
和 0-9
组成的简单 ASCII 字符串,则为 k = 26 + 10 = 30
。
给定任何键,我们可以生成所有可能的键,这些键距离一个字符:有 127 * k
这样的字符串。在您将每个键与大约 150,000 个其他键进行比较之前,现在我们只需要与 127 * k
进行比较,在 k = 30
的情况下为 3810。这将整体时间复杂度从 O(n^2)
降低到 O(n * k)
,其中 k
是一个独立于 n
的常量。 这是当您扩展 n
时真正加速的地方。
这里有一些代码可以生成一个键的所有可能的邻居:
def generate_neighbors(key, alphabet):
for i in range(len(key)):
left, right = key[:i], key[i+1:]
for char in alphabet:
if char != key[i]:
yield left + char + right
所以,例如:
>>> set(generate_neighbors('ab', {'a', 'b', 'c', 'd'}))
{'aa', 'ac', 'ad', 'bb', 'cb', 'db'}
现在我们计算每个键的邻域:
def compute_neighborhoods(data, alphabet):
keyset = set(data.keys())
for key in data:
possible_neighbors = set(generate_neighbors(key, alphabet))
neighbors = possible_neighbors & keyset
identifier = data[key][0]
for neighbor in neighbors:
data[neighbor][1].append(identifier)
现在举个例子。假设
data = {
'0a': [4, []],
'1f': [9, []],
'27': [3, []],
'32': [8, []],
'3f': [6, []],
'47': [1, []],
'7c': [2, []],
'a1': [0, []],
'c8': [7, []],
'e2': [5, []]
}
然后:
>>> alphabet = set('abcdef01234567890')
>>> compute_neighborhoods(data, alphabet)
>>> data
{'0a': [4, []],
'1f': [9, [6]],
'27': [3, [1]],
'32': [8, [5, 6]],
'3f': [6, [8, 9]],
'47': [1, [3]],
'7c': [2, []],
'a1': [0, []],
'c8': [7, []],
'e2': [5, [8]]}
还有一些优化我没有在这里实现。首先,你说这些键在后面的字符上大多不同,而且它们最多在 11 个位置不同。这意味着我们可以更聪明地计算交集 possible_neighbors & keyset
和生成邻域。首先,我们修改 generate_neighbors
以首先修改 key 的 trailing 字符。然后,我们不是一次生成整个邻居集,而是一次生成一个,并检查是否包含在 data
字典中。我们跟踪找到了多少个,如果找到 11 个,我们就会中断。
我没有在我的回答中实现这个的原因是我不确定它是否会导致显着的加速,并且实际上可能更慢,因为这意味着删除优化的 Python带有纯 Python 循环的内置(设置交集)。
关于python - for loop in for loop 的更快替代方案,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34114554/
我应该编写一个函数来打印一组给定的三个数字中两个较大数字的平方和。 我对这种情况的处理相当笨拙。我没有编写返回一组 3 中最大的两个数字的函数,而是编写了函数,以便表达式减少到两个所需的数字。 # S
如果有人可以提供帮助,我将不胜感激。我一直在敲我的头一天试图让这个工作。我已经在互联网上搜索并重新阅读了手册,但我就是不明白。 guile << __EOF__ ( define heading-li
目前我正在处理一个方案问题,其中我们正在使用方案列表表示一个图。我们使用的第一个变体是表示为 的边列表图 '((x y) (y z) (x z)) 我们正在使用的图的第二个变体被称为 x 图,表示为
我正在尝试创建一个函数,该函数将两个函数作为参数并执行它们。 我尝试使用 cond ,但它只执行 action1 . (define seq-action (lambda (action1 act
我提前为我的原始英语道歉;我会尽量避免语法错误等。 两周前,我决定更新我对 Scheme(及其启示)的知识,同时实现我在手上获得的一些数学 Material ,特别是我注册的自动机理论和计算类(cla
Scheme中有没有函数支持分数的“div”操作? 意思是 - 11 格 2.75 = 4。 最佳答案 我认为你的问题的答案是:没有,但你可以定义它: #lang racket (define (di
我在scheme中实现合并排序,我必须通过定义两个辅助方法来实现:merge和split。 Merge 需要两个列表(已经按递增顺序)并将它们合并在一起。我这样做了如下: (define merge
尝试从终端加载方案文件。我创建了一个名为 test.scm 的文件,其中包含以下代码: (define (square x) (* x x)) (define (sum-of-squares x y)
我有以下代码: (define (howMany list) (if (null? list) 0 (+ 1 (howMany (cdr list))))) 如果我们执行以
我有点了解如何将基本函数(例如算术)转换为Scheme中的连续传递样式。 但如果函数涉及递归怎么办?例如, (define funname (lambda (arg0 arg1)
我正在尝试附加两个字符串列表 但我不知道如何在两个单词之间添加空格。 (define (string-concat lst1 lst2) (map string-append lst1
这个问题已经有答案了: How do I pass a list as a list of arguments in racket? (2 个回答) 已关闭 8 年前。 我有一个函数,它需要无限数量的
我对这段代码的工作方式感到困惑: (define m (list 1 2 3 '(5 8))) (let ((l (cdr m))) (set! l '(28 88))) ==>(1 2 3 (5 8
我正在为学校做一项计划作业,有一个问题涉及我们定义记录“类型”(作为列表实现)(代表音乐记录)。 我遇到的问题是我被要求创建一个过程来创建这些记录的列表,然后创建一个将记录添加到该列表的函数。这很简单
我有以下代码: (define (howMany list) (if (null? list) 0 (+ 1 (howMany (cdr list))))) 如果我们执行以
我正在尝试附加两个字符串列表 但我不知道如何在两个单词之间添加空格。 (define (string-concat lst1 lst2) (map string-append lst1
如何使用抽象列表函数(foldr、foldl、map 和 filter 编写函数),无需递归,消耗数字列表 (list a1 a2 a3 ...) 并产生交替和 a1 - a2 + a3 ...? 最
我试图找出在 Scheme 中发生的一些有趣的事情: (define last-pair (lambda (x) (if (null? (cdr x))
这个问题在这里已经有了答案: Count occurrence of element in a list in Scheme? (4 个答案) 关闭 8 年前。 我想实现一个函数来计算列表中元素出现
我正在尝试使用下面的代码获取方案中的导数。谁能告诉我哪里出错了?我已经尝试了一段时间了。 (define d3 (λ (e) (cond ((number? e) 0) ((e
我是一名优秀的程序员,十分优秀!