- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试读取通过向 NCBIblast 网站提交多个序列而生成的 XML 文件列表。我想从每个文件中打印某些信息行。我想要读取的文件都带有后缀“_recombination.xml”
。
for file in glob.glob("*_recombination.xml"):
result_handle= open(file)
blast_record=NCBIXML.read(result_handle)
for alignment in blast_record.alignments:
for hsp in alignment.hsps:
print "*****Alignment****"
print "sequence:", alignment.title
print "length:", alignment.length
print "e-value:", hsp.expect
print hsp.query
print hsp.match
print hsp.sbjct
该脚本首先找到所有带有 "_recombination.xml"
后缀的文件,然后我希望它读取每个文件,并打印某些行(这几乎是 BioPython 的直接副本) cooking 书),似乎确实如此。但我收到以下错误:
Traceback (most recent call last):
File "Scripts/blast_test.py", line 202, in <module>
blast_record=NCBIXML.read(result_handle)
File "/Library/Python/2.7/site-packages/Bio/Blast/NCBIXML.py", line 576, in read
first = iterator.next()
File "/Library/Python/2.7/site-packages/Bio/Blast/NCBIXML.py", line 643, in parse
expat_parser.Parse("", True) # End of XML record
xml.parsers.expat.ExpatError: no element found: line 3106, column 7594
我不太确定问题是什么。我不确定它是否试图循环遍历已读取的文件 - 例如,关闭文件似乎有帮助:
for file in glob.glob("*_recombination.xml"):
result_handle= open(file)
blast_record=NCBIXML.read(result_handle)
for alignment in blast_record.alignments:
for hsp in alignment.hsps:
print "*****Alignment****"
print "sequence:", alignment.title
print "length:", alignment.length
print "e-value:", hsp.expect
print hsp.query
print hsp.match
print hsp.sbjct
result_handle.close()
blast_record.close()
但它也给了我另一个错误:
Traceback (most recent call last):
File "Scripts/blast_test.py", line 213, in <module> blast_record.close()
AttributeError: 'Blast' object has no attribute 'close'
最佳答案
我通常使用parse方法而不是read方法,也许它可以帮助你:
for blast_record in NCBIXML.parse(open(input_xml)):
for alignment in blast_record.alignments:
for hsp in alignment.hsps:
print "*****Alignment****"
print "sequence:", alignment.title
print "length:", alignment.length
print "e-value:", hsp.expect
print hsp.query
print hsp.match
print hsp.sbjct
并确保您的 xml 是在查询爆炸中使用 -outfmt 5 生成的
关于python - 读取多个blast文件(biopython),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15406046/
我在 stackexchange 的生物信息学版本上问过这个问题,但由于我认为这是一个计算机问题,所以我认为我应该在这里试试运气。 在大型数据库(所有人类蛋白质)上运行本地 BLAST (v2.2.2
我建立了一个 blast 本地数据库。但是,当我运行 blastn 命令时,我收到了这条错误消息: T0 "/home/coremake/release_build/build/PrepareRele
我正在编写一个 python 脚本,并希望将查询序列信息作为字符串变量而不是 FASTA 格式文件(如果可能)传递给 blastn。 我使用 Biopython 的 SeqIO 将多个转录名称存储为键
我知道这是一个与 BLAST 和生物信息学相关的非常具体的问题,但这里是: 我正在尝试使用独立的 BLAST(我已经下载了它并测试了它在命令行上运行)来执行 DNA 序列比对 (blastn)。我需要
我想使用 CSS 为径向渐变圆制作动画,以扩展页面的整个长度和宽度(完全变白),然后反转此动画(返回到原始状态)。这应该看起来像是从中心逐渐“爆炸”的白色,一旦达到全宽度/高度就逐渐变为全白色,但是我
我是编程新手,过去几周我一直在研究生物信息学问题,但进展非常有限。 我有一个包含大量基因组的大型 FASTA 文件,我希望运行全对全 BLAST 搜索,该搜索将识别同系物/直系同源物(将通过使用 -o
我有一个执行 BLAST 查询的脚本 (bl2seq) 脚本是这样工作的: Get sequence a, sequence b write sequence a to filea write seq
我刚刚遇到blast.js并在尝试运行 example 时遇到问题。该示例在 codepen 上完美运行,但在我本地的机器上不起作用。控制台报告以下警告和错误。非常感谢社区的帮助。 Warning:
我有一个问题,我需要解析以下数据框: cluster_name qseqid sseqid pident_x qstart qend sstar send 2
所以我有一个我正在构建的电子邮件群发并且对 HTML 特定的电子邮件群发还很陌生,我的图像和链接工作正常但我的问题是在手机上查看群发时我尝试嵌入的媒体查询是'工作。 我正在使用 ASP.NET 和 H
我正在创建一个将位 vector 公式转换为命题逻辑形式的函数。一种称为“位爆炸”的策略将此类位 vector 表达式处理为 PL 形式。 我一直在尝试创建一个接受位 vector 表达式并对其应用位
我有一个 h1 和一个带有 ul 和 li 的 nav。当鼠标移到 h1 上时,h1 开始动画并且 li 淡入。但是列表不在它应该位于的位置之后动画片。最初列表以 display:inline 居中,
我有一个标准格式的 BLAST outfmt 6 输出文件,我想找到一种方法来遍历该文件,选择每个命中,找到它的倒数命中并解密哪个是最好的存储命中。 例如: d = {} for line in in
我有一个 XML 格式的 BLAST 输出文件。它是 22 个查询序列,每个序列报告 50 个命中。我想提取所有 50x22 的匹配项。这是我目前拥有的代码,但它只从第一个查询中提取 50 次匹配。
这是我第一次在 biopython 中使用 blast,我遇到了问题。 我使用包含 20 个序列的 fasta 文件创建了一个自定义 blast 数据库: os.system('makeblastdb
我试图仅从 NCBI xml BLAST 文件中提取第一个匹配项。接下来我只想获得第一个 HSP。在最后阶段,我想根据最好的分数获得这些。为了在此处清楚说明 xml 文件的示例: blast
我正在开发一个小型应用程序,并考虑将 BLAST 或其他本地比对搜索集成到我的应用程序中。我的搜索只调出程序,需要作为外部程序安装和调用。 从头开始实现它还有什么办法吗?可能有任何预制库吗? 最佳答案
我正在使用 blast.js 来制作两个单词的动画,并使用 jquery ui 来制作颜色动画。我尝试过的一切都没有奏效。 DEMO CSS 与 DEMO 无关,因为颜色按钮没有 css 规则。 va
返回值错误:searchIO_utils.py 的 get_processor 中第 25 行需要格式(小写字符串)。 AtCBL1_CDS.txt 是一个包含 fasta 格式的蛋白质序列的文件。
我使用 php 将作业提交给 torque (pbs),它(torque)生成的输出为:“此帐户目前不可用。” 我认为它引用了运行 httpd(apache) 的帐户apache 是一个“/sbin/
我是一名优秀的程序员,十分优秀!