gpt4 book ai didi

javascript - 无法使用 Jsoup 找到一些 html 元素

转载 作者:太空宇宙 更新时间:2023-11-04 00:49:46 24 4
gpt4 key购买 nike

我正在尝试使用 Jsoup 在此页面 ( https://gwlabs.taleo.net/careersection/gw_ext_career_section/jobsearch.ftl ) 中查找与“应用”按钮对应的元素。我尝试使用 Document.getElementsMatchingOwnText("Apply") 但它没有返回元素。我试图列出所有 anchor 元素并打印它们的文本,但我看不到任何带有文本“应用”的元素。输出如下

anchor 文本为Sign In

anchor 文字为Job Search

anchor 文本是我的工作页面

anchor 文本可以

anchor 文本可以

anchor 文字为提交好友资料

anchor 文本是查看所有职位

anchor 文本为高级搜索

anchor 文本为Add Organization

anchor 文本为Add Location

anchor 文本为Add Job Field

anchor 文本为取消

anchor 文本为Add

anchor 文本可以

anchor 文字清晰

anchor 文本是保存此搜索

anchor 文本为单行

anchor 文本是保存此搜索

anchor 文本为取消

anchor 文本是访问我保存的搜索

anchor 文本为确认

anchor 文本为取消

anchor 文本可以

anchor 文本可以

anchor 文本可以

anchor 文本是您还可以查看所有可用的职位空缺。

anchor 文本是推荐 friend

anchor 文本是上一个

anchor 文本是下一个

anchor 文本可以

同样的方法为 https://healthfirst.taleo.net/careersection/hf_ext_cs/jobsearch.ftl?lang=en 提供了预期的结果我不知道为什么会这样,有人可以看看吗

最佳答案

您尝试检索的数据不是初始 html 的一部分,而是在页面加载后由 JavaScript 设置的。您可以通过在浏览器中禁用 JavaScript 来检查它。 Jsoup只获取静态html,不执行JavaScript代码。

Jsoup 目前不支持 JavaScript,这意味着使用 Jsoup 解析时将无法使用使用 JavaScript 加载数据的页面。

如果你想获取这种动态加载的数据,你可以:

-使用替代方案,例如 HtmlUnit、Selenium WebDriver 或 ui4j。

-使用网站的 API,如果它提供的话,

-要找出网站从何处加载其数据,通常您需要做的就是在某处发送 HTTP 请求以获取 JSON 格式的数据。

可以在这里找到更多详细信息: https://stackoverflow.com/tags/jsoup/info

或者您可以使用此答案中的提示: https://stackoverflow.com/a/50831894

关于javascript - 无法使用 Jsoup 找到一些 html 元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56221804/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com