gpt4 book ai didi

java - 使用 JSOUP 从另一个网站获取数据

转载 作者:行者123 更新时间:2023-12-02 10:40:00 25 4
gpt4 key购买 nike

基本上,我需要一张 table ,里面有所有可能存在的书籍,但我不想这样做,因为我是一个非常懒的人 xD。所以,我的问题是..我可以使用一个我想到的网站,就像切断这个网站的其余部分(我不需要)并只留下搜索部分(也许可以做一些改变)布局)...然后,进行搜索,找到这本书并仅将对我有意义的数据存储在我的数据库中。那可能吗?我听说 JSOUP 可以提供帮助。所以,我只想要一些提示。 (感谢阅读)。

网站:http://www.isbn.bn.br/website/consulta/cadastro

最佳答案

是的,您可以使用 Jsoup 来做到这一点,主要问题是您共享的 URL 使用 JavaScript,因此您需要使用 Selenium 来强制 JS 执行,或者您也可以获取图书 URL 并解析它。

使用Jsoup解析网页的方法是:

Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
.userAgent("Mozilla/5.0")
.get();

您检索文档中的整个 HTML,以便您可以使用 CSS 选择器获取该元素中包含的任何元素,例如,如果您想在 HTML 中检索网页的标题,您可以使用:

Elements elements = document.select("title");

对于您想要从中检索信息的每个 HTML 标记。您可以查看 Jsoup 文档并检查一些解释的示例:Jsoup

希望对你有帮助!

关于java - 使用 JSOUP 从另一个网站获取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52981323/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com