- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试对一组具有多个可能碱基的 DNA 串进行球状扩展。
我的 DNA 字符串的基数包含字母 A、C、G 和 T。但是,我可以有特殊字符,例如 M,它可以是 A 或 C。
例如,假设我有字符串:
自动取款机
我想将这个字符串作为输入并输出四个可能匹配的字符串:
ATAA
ATAC
ATCA
ATCC
我觉得必须有一些优雅的 Python/Perl/Regular Expression 技巧才能做到这一点,而不是暴力破解解决方案。
感谢您的任何建议。
编辑,感谢 cortex 的产品运营商。这是我的解决方案:
仍然是 Python 新手,所以我敢打赌有比另一个 for 循环更好的方法来处理每个字典键。任何建议都会很棒。
import sys
from itertools import product
baseDict = dict(M=['A','C'],R=['A','G'],W=['A','T'],S=['C','G'],
Y=['C','T'],K=['G','T'],V=['A','C','G'],
H=['A','C','T'],D=['A','G','T'],B=['C','G','T'])
def glob(str):
strings = [str]
## this loop visits very possible base in the dictionary
## probably a cleaner way to do it
for base in baseDict:
oldstrings = strings
strings = []
for string in oldstrings:
strings += map("".join,product(*[baseDict[base] if x == base
else [x] for x in string]))
return strings
for line in sys.stdin.readlines():
line = line.rstrip('\n')
permutations = glob(line)
for x in permutations:
print x
最佳答案
同意其他发帖人的观点,想做这件事似乎很奇怪。当然,如果您真的想要,在 Python (2.6+) 中(一如既往)有一种优雅的方法:
from itertools import product
map("".join, product(*[['A', 'C'] if x == "M" else [x] for x in "GMTTMCA"]))
具有输入处理的完整解决方案:
import sys
from itertools import product
base_globs = {"M":['A','C'], "R":['A','G'], "W":['A','T'],
"S":['C','G'], "Y":['C','T'], "K":['G','T'],
"V":['A','C','G'], "H":['A','C','T'],
"D":['A','G','T'], "B":['C','G','T'],
}
def base_glob(glob_sequence):
production_sequence = [base_globs.get(base, [base]) for base in glob_sequence]
return map("".join, product(*production_sequence))
for line in sys.stdin.readlines():
productions = base_glob(line.strip())
print "\n".join(productions)
关于python - 寻找优雅的 glob-like DNA 字符串扩展,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1098461/
这个问题已经有答案了: 奥 git _a (40 个回答) 已关闭 4 年前。 我有一个包含不同类型文件的文件夹。我只需要处理图像文件(jpg、png、jpeg、JPG...)。为此,我使用 glob
我编写了以下 Python 代码: #!/usr/bin/python # -*- coding: utf-8 -*- import os, glob path = '/home/my/path' f
我正在尝试使用 glob 和 os 在目录中找到最新的 .zip 文件。有趣的是,我进行了以下设置并且以前可以正常工作: max(glob.glob('../directory/*.zip'), ke
这是一个非常愚蠢的问题,但我还没有真正找到令人满意的答案:How do I use gulp globbing to select all files in all某个目录下的子目录? 我已经尝试过:
我正在尝试为 CLI 脚本之一提供通配符支持,并且我正在使用 pythons glob 模块。为了进行测试,我尝试了以下方法: >>> import glob >>> for f in glob.gl
目前我的os.walk代码列表是指定目录下所有目录下的所有文件。 top = /home/bludiescript/tv-shows for dirpath, dirnames, fi
有一点奇怪的问题,因为这段代码似乎在我 friend 的 mac 上运行良好,但在我的 ubuntu 16.04 上根本不起作用。 通过我的 python,我正在运行以下命令 filenames =
import glob list = glob.glob(r'*abc*.txt') + glob.glob(r'*123*.txt') + glob.glob(r'*a1b*.txt') for i
我编写了以下 Python 代码: #!/usr/bin/python # -*- coding: utf-8 -*- import os, glob path = '/home/my/path' f
我想知道是否可以使用 glob.glob("**/*.jpg") 来获取多个文件夹中的所有图像,但作为迭代器以避免填充内存 目前,我将以下代码与 glob 一起使用: for file in glob
当我尝试运行此代码时: import pandas as pd import glob files = [pd.read_excel(p, skipfooter=1) for p in glob.gl
我的桌面上有一个文件夹,其中包含 200 多个 txt 文件。我想在每个文件中打印行号 1050.539。这是我所拥有的: import glob f=glob.glob('/Users/me/Des
我注意到 glob.glob('**/*', recursive=True) 以呼吸优先搜索的方式遍历目录。有没有办法让它成为深度优先? 最佳答案 要遍历目录树,请切换到 os.walk它可以让你控制
我正在尝试使用 python 3 从包含文本文档的文件夹中读取数据。具体来说,这是对 LingSpam 垃圾邮件数据集的修改。我希望我编写的代码返回所有 1893 个文本文档名称,但是,代码反而返回前
现在,我使用 subprocess 来调用 find ,它可以很好地完成工作,但我追求的是 pythonic 的做事方式。 这是当前代码: cmd = "find /sys/devices/pci*
这个问题在这里已经有了答案: How to use glob() to find files recursively? (28 个回答) 关闭去年。 我想打开一个文件夹中的一系列子文件夹并找到一些文本
我可以使用 boto3 的过滤器工具在存储桶中查找类似于使用 glob 目录中的文件的键(技术上是子键)吗? 我想得到一个具有这样模式的键列表 "key/**//**.gz" . 最佳答案 不幸的是没
我正在寻找一些用 BFN 规则描述的广泛扩展的方言(比如这个 https://github.com/vmeurisse/wildmatch + globstar **)。 任何格式或语言。 OMeta
我有以下nodejs代码。客户端首先调用/api/demosounds,然后调用/api/testsounds。 var glob = require('glob-fs')({ gitignore:
我使用以下命令在python中读取目录中所有文件的名称: import glob list_of_files = glob.glob(".../*.txt") 但是列表“list_of_files”的
我是一名优秀的程序员,十分优秀!