gpt4 book ai didi

java - Document.select ("a[href]")未获取所有 href

转载 作者:行者123 更新时间:2023-11-30 02:01:30 25 4
gpt4 key购买 nike

我正在使用 JSOUP 从网站获取文档。

下面是我的代码

webPageUrl = https://mwcc.ms.gov/#/electronicDataInterchange
Document doc = Jsoup.connect(webPageUrl).get();
Elements links = doc.getElementsByAttribute("a[href]");

下面的代码行不起作用。它应该返回一个元素,但没有:

doc.getElementsByAttribute("a[href]") 

有人可以指出我代码中的错误吗?

最佳答案

该页面似乎是一个 Angular 应用程序,这意味着它通过 JavaScript 脚本加载部分(可能是全部或大部分)内容。

URL 包含片段分隔符 # 的事实已经是该事实的有力指示符,因为如果您执行 HTTP 请求,则该指示符之后的所有内容都会被切断(即不会发送到服务器),因此实际请求将只是 https://mwcc.ms.gov/

据我所知,JSoup 不支持运行 JavaScript,因此您可能需要研究更复杂的抓取工具(可能运行完整的浏览器引擎)。

关于java - Document.select ("a[href]")未获取所有 href,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52715992/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com