gpt4 book ai didi

python - 在python中查找一组字符串的最小汉明距离

转载 作者:太空狗 更新时间:2023-10-29 22:13:16 24 4
gpt4 key购买 nike

我有一组 n (~1000000) 个字符串(DNA 序列)存储在列表 trans 中。我必须找到列表中所有序列的最小汉明距离。我实现了一个naive brute force algorithm,运行了一天多了,还没有给出解决方案。我的代码是

dmin=len(trans[0])
for i in xrange(len(trans)):
for j in xrange(i+1,len(trans)):
dist=hamdist(trans[i][:-1], trans[j][:-1])
if dist < dmin:
dmin = dist

有没有更有效的方法来做到这一点?这里的 hamdist 是我编写的用于查找汉明距离的函数。这是

def hamdist(str1, str2):
diffs = 0
if len(str1) != len(str2):
return max(len(str1),len(str2))
for ch1, ch2 in zip(str1, str2):
if ch1 != ch2:
diffs += 1
return diffs

最佳答案

您可以通过添加一个可选参数来优化您的 hamdist 函数,该参数包含您目前获得的最小距离,这样,如果 diffs 达到该值,您将停止计算距离因为这种比较会给你一个比最小距离更大的距离:

def hamdist(str1, str2,prevMin=None):
diffs = 0
if len(str1) != len(str2):
return max(len(str1),len(str2))
for ch1, ch2 in zip(str1, str2):
if ch1 != ch2:
diffs += 1
if prevMin is not None and diffs>prevMin:
return None
return diffs

您需要调整您的主循环以使用 Nonehamdist 返回值:

dmin=len(trans[0])
for i in xrange(len(trans)):
for j in xrange(i+1,len(trans)):
dist=hamdist(trans[i][:-1], trans[j][:-1])
if dist is not None and dist < dmin:
dmin = dist

关于python - 在python中查找一组字符串的最小汉明距离,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24624415/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com