- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试使用 Entrez 将发布数据导入数据库。搜索部分工作正常,但是当我尝试解析时:
from Bio import Entrez
def create_publication(pmid):
handle = Entrez.efetch("pubmed", id=pmid, retmode="xml")
records = Entrez.parse(handle)
item_data = records.next()
handle.close()
...我收到以下错误:
File "/venv/lib/python2.7/site-packages/Bio/Entrez/Parser.py", line 296, in parse raise ValueError("The XML file does not represent a list. Please use Entrez.read instead of Entrez.parse") ValueError: The XML file does not represent a list. Please use Entrez.read instead of Entrez.parse
这段代码在几天前一直有效。知道这里可能出了什么问题吗?
此外,查看源代码 ( http://biopython.org/DIST/docs/api/Bio.Entrez-pysrc.html ) 并尝试按照列出的示例进行操作,也会出现相同的错误:
from Bio import Entrez
Entrez.email = "Your.Name.Here@example.org"
handle = Entrez.efetch("pubmed", id="19304878,14630660", retmode="xml")
records = Entrez.parse(handle)
for record in records:
print(record['MedlineCitation']['Article']['ArticleTitle'])
handle.close()
最佳答案
问题,如其他评论和 GitHub Issue 中所述, 是由 NCBI Entrez Utilities Developers 故意更改引起的。如 Jhird 在本期中所述,您可以将代码更改为以下内容:
from Bio import Entrez
Entrez.email = "Your.Name.Here@example.org"
handle = Entrez.efetch("pubmed", id="19304878,14630660", retmode="xml")
records = Entrez.read(handle) # Difference here
records = records['PubmedArticle'] # New line here
for record in records:
print(record['MedlineCitation']['Article']['ArticleTitle'])
handle.close()
关于python - 使用 Entrez 解析来自 PubMed 的出版数据的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41286823/
我正在使用 Biopython 查询 PubMed 的一些结果。这是代码的一部分: def search(query): Entrez.email = 'gandalf@rivende
我有一个包含 300 个名字的大列表 data。例如: dput(data$name1) c("55024", "29126", "3732", "1960", "79368", "115352",
抱歉,奇怪的标题。 我正在使用 eSearch 和 eSummary 从 登录号 --> gID --> TaxID 假设“accessions”是一个包含 20 个登录号的列表(我一次做 20 个,
我们目前正在开展一个项目,需要从 ClinVar 访问“NP_”登录号。然而,当我们使用 Entrez.eFetch( ) 函数时,结果中似乎缺少此信息。以下是列出 NP_ 编号的网站页面的链接: h
我是 Biopython 新手。使用此代码: handle = Entrez.esearch(db="nuccore", term="complete", field="title", FILT="r
快速提问 -- 第一次使用 biopython,我只是想根据教程快速尝试一些真正快速的东西。 我似乎无法让 Entrez.efetch() 返回给定文章的网格术语,唯一的方法似乎是我正在做的,即: h
当我运行以下命令时; from Bio.Blast import NCBIWWW from Bio import Entrez, SeqIO Entrez.email = "A.N.Other@exa
我必须从 NCBI(GenBank(完整)格式)下载完整的基因组序列。我感兴趣的是“完整基因组”而不是“全基因组”。 我的脚本: from Bio import Entrez Entrez.email
我正在尝试使用 Entrez 将发布数据导入数据库。搜索部分工作正常,但是当我尝试解析时: from Bio import Entrez def create_publication(pmid):
我是 python 的新手,想使用 bio 包中的 entrez 系统从 pubmed 中提取摘要。我通过电子搜索获得了我的 UID(存储在 my_list_ges 中),我还可以使用 efetch
我正在尝试从 PMC/Pubmed 下载完整的标题/摘要数据。这是一个古老的问题,但 stackoverflow 上的答案似乎都没有答案。 一般方法是使用 Entrez 包,但话又说回来,您需要指定搜
我正在尝试使用 Biopython entrez 收集已发布文章的列表。我想从 medline 格式收集文章的某些部分。如果没有设置 retmax,我下面编写的代码将起作用。默认为 20 篇文章,但是
我有一个 refseq ID 列表 (keys_list),我用它来使用 BioPython Entrez 下拉序列记录。我只想访问返回的 fasta 记录中的序列,但我不想将记录写入文件才能执行此操
我今天遇到了这个,想把它扔掉。看来使用 NCBI 的 Entrez Biopython 接口(interface),不可能以正确(与输入相同)的顺序返回结果(至少从 elink )。请参阅下面的代码示
我正在开发一个项目,该项目要求我使用 Excel 电子表格中的输入来搜索 pubmed 并打印结果计数。我一直在使用 xlrd 和 entrez 来完成这项工作。这是我尝试过的。 我需要使用作者姓名、
我正在尝试从 NCBI Entrez Gene 数据库中检索和保存基因摘要,并且也想保留 uid,但是,尽管它在那里,但我找不到从结果中检索它的正确方法。见下文(注意:显然不是我在这里使用的有效电子邮
我使用Entrez Utilities Web Service library从我的 Java 应用程序访问 pubmed 文章(使用 pubmed 标识符)。如何使用此工具的完整工作示例由 Rena
很快就会很明显,我是 Python 和一般编码的新手。我有一个存储为文本文件的基因 ID 列表,我想使用 Entrez 函数搜索 GenBank 数据库并检索与 ID 对应的蛋白质序列。理想情况下,我
我正在尝试搜索标题中包含特定单词的论文。更准确地说,是 2010 年至 2015 年间发表的论文中的病毒或病毒一词。这是我的代码: import re from Bio import Medline
我在使用 Bio.Entrez 搜索蛋白质时遇到问题。我正在这样做: >>> handle=Entrez.esearch(db="protein", term="insulin AND homo")
我是一名优秀的程序员,十分优秀!