gpt4 book ai didi

Java PubMed 阻止 url 请求

转载 作者:太空宇宙 更新时间:2023-11-04 07:11:35 24 4
gpt4 key购买 nike

我有一些代码可以访问 PubMed 中的文章并解析每个 XML 中的一些信息。该程序在我的计算机上运行良好,但需要很多时间才能完成。因此,当我在 UNIX 机器上运行它(特别是对于此类事情)时,我发出的每个请求都会被阻止。在机器将其视为病毒之前,每分钟可以发出的数量是有限制的,但这不是问题,因为所有请求都被阻止。我查了一下,只有 PubMed 网站上的请求才会发生这种情况。

提前致谢

编辑:我使用 jsoup 进行连接。从我的程序中使用 ProcessBuilder 运行 wget 不会被阻塞,但随后效率就成为一个问题,因为 wget 的输出只能使用 while(br.readline() != null) 读取,并且这会占用大量运行时间。

最佳答案

您可以尝试通过其他专门用于检索已发布数据的 API 进行连接,而不是访问已发布的网页,例如 RESTful Web 服务:http://europepmc.org/RestfulWebService 。它允许您以 xml 格式获取所需的所有数据,并且我认为查询数量没有限制。

例如,如果您想获取pubmed_id=9481671文章的所有信息,则需要访问网页:http://www.ebi.ac.uk/europepmc/webservices/rest/search/resulttype=core&query=ext_id:9481671

关于Java PubMed 阻止 url 请求,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20572248/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com