- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我希望能够加入存储在“indata”和“pairdata”中的两个“字典”,但是这段代码,
indata = SeqIO.index(infile, infmt)
pairdata = SeqIO.index(pairfile, infmt)
indata.update(pairdata)
indata.update(pairdata)
TypeError: update() takes exactly 1 argument (2 given)
indata = SeqIO.to_dict(SeqIO.parse(infile, infmt))
pairdata = SeqIO.to_dict(SeqIO.parse(pairfile, infmt))
indata.update(pairdata)
indata = SeqIO.index_db(indexfile, [infile, pairfile], infmt)
最佳答案
SeqIO.index
返回一个只读的类似字典的对象,所以 update
将无法处理它(对于令人困惑的错误消息深表歉意;我刚刚在主 Biopython 存储库中检查了该问题的修复程序)。
最好的方法是使用 index_db,它会更慢但
只需要索引文件一次,或者定义一个更高级别的对象
它的作用就像是您的多个文件的字典。这里有一个
简单的例子:
from Bio import SeqIO
class MultiIndexDict:
def __init__(self, *indexes):
self._indexes = indexes
def __getitem__(self, key):
for idx in self._indexes:
try:
return idx[key]
except KeyError:
pass
raise KeyError("{0} not found".format(key))
indata = SeqIO.index("f001", "fasta")
pairdata = SeqIO.index("f002", "fasta")
combo = MultiIndexDict(indata, pairdata)
print combo['gi|3318709|pdb|1A91|'].description
print combo['gi|1348917|gb|G26685|G26685'].description
print combo["key_failure"]
关于biopython - 如何连接两个或多个由 Bio.SeqIO.index 创建的词典?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7906766/
我有一个字典中的蛋白质序列比对(id_prot 作为键,比对序列作为值;可以是另一种格式),我想使用这个比对来用 Biopython 构建 NJ 树 但是,根据文档,加载用于系统发育分析的序列的唯一方
我刚刚加入 python 和 biopython 工作,喜欢连接 Ensebml 并获取一些序列和其他数据,如 TSS、一些基因列表等。但我的问题是我似乎无法在 biopython 中找到任何方法或模
我想知道如何使用 biopython 库将多个 pdb 写入单个 pdb 文件。对于读取NMR结构等多个pdb,documentation中有内容但对于写作,我没有找到。有人对此有想法吗? 最佳答案
我是 Stackoverflow 的新手。我正在尝试使用 Biopython 自动化搜索过程。我有两个列表,一个是蛋白质 GI 编号,另一个是相应的核苷酸 GI 编号。 例如: 蛋白质_GI=[588
我正在尝试读取通过向 NCBIblast 网站提交多个序列而生成的 XML 文件列表。我想从每个文件中打印某些信息行。我想要读取的文件都带有后缀“_recombination.xml”。 for fi
我有一个 newick 格式的系统发育树。我想根据终端节点的标签(因此基于物种列表)拉出一棵子树。我正在使用的树的副本可以在这里找到:http://hgdownload.soe.ucsc.edu/go
import gzip import io from Bio import SeqIO infile = "myinfile.fastq.gz" fileout = open("myoutfile.f
我第一次使用biopython。如果这是一个基本问题,请原谅我。 我想输入序列,然后对齐它们,并能够引用原始序列(无间隙)和对齐序列(有间隙)的索引位置。 我的现实世界示例是烯醇 enzyme (Un
我目前正在(作为一个高级项目)构建和实现一个生物信息学 Web 应用程序来操作大数据以及一些复杂的工作 我正在使用biopython 哪种云计算平台最好,为什么? 提前致谢 最佳答案 我一直在尝试使用
Biopython 菜鸟,我正在尝试创建一个程序,该程序使用 Biopython 包 Alphabet 和字母表模块 IUPAC 将列出的类的字母写出到名为 AlphabetSoupOuput.txt
我正在尝试在 biopython 中循环运行大约 10000 对字符串的成对全局对齐方法。每个字符串平均长度为 20 个字符。为一对序列运行该方法效果很好。但是在一个循环中运行它,低至 4 对,会导致
我正在尝试为 Biopython 的朴素贝叶斯代码添加拉普拉斯平滑支持 1对于我的生物信息学项目。 我已经阅读了很多关于朴素贝叶斯算法和拉普拉斯平滑的文档,我想我已经了解了基本的想法,但我无法将其与该
我正在使用 BioPython MuscleCommanLine 来比对子进程中的序列。肌肉的输入和输出是标准输入和标准输出。这行得通,但是一旦 popen 调用 muscle,我就会在屏幕上从 mu
在讨论如何使用 Bio.SeqIO.parse() 导入序列数据时,BioPython 说明书指出: There is an optional argument alphabet to specify
我目前有以下查询 pubmed 的代码: from Bio import Entrez Entrez.email = "kuharrw@hiram.edu" # Always tell NCB
例如...我有两个脚本用于查看(多序列比对)MSA 是否具有超过 50 列且间隙少于 50%。 第一次使用 BioPython 需要 4.2 秒,在 609 列的 16281 个序列的 MSA 中(f
我正在尝试更改以前的脚本,该脚本利用 biopython 获取有关物种门的信息。编写此脚本是为了一次检索一个物种的信息。我想修改脚本,以便我可以一次对 100 个生物执行此操作。 这是初始代码 imp
在尝试使用biopython解析xml文件时,我遇到了一些我不明白的错误,有人可以帮助我理解这个错误吗? TypeError: object of type 'generator' has no le
我正在尝试将 Biopython (Entrez) 与搜索词一起使用,该搜索词将返回登录号(而不是 GI*)。 这是我的代码的一小段摘录: from Bio import Entrez Entrez.
我有一些蛋白质,我想找到它们相应的核苷酸序列。我还有发现该蛋白质的基因组。在基因组中,我找到了该蛋白质对应的基因ID。但是,我无法通过基因 ID 获取核苷酸序列。我尝试过使用 Entrez Efetc
我是一名优秀的程序员,十分优秀!