- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试使用 Jsoup 在此页面 ( https://gwlabs.taleo.net/careersection/gw_ext_career_section/jobsearch.ftl ) 中查找与“应用”按钮对应的元素。我尝试使用 Document.getElementsMatchingOwnText("Apply") 但它没有返回元素。我试图列出所有 anchor 元素并打印它们的文本,但我看不到任何带有文本“应用”的元素。输出如下
anchor 文本为Sign In
anchor 文字为Job Search
anchor 文本是我的工作页面
anchor 文本可以
anchor 文本可以
anchor 文字为提交好友资料
anchor 文本是查看所有职位
anchor 文本为高级搜索
anchor 文本为Add Organization
anchor 文本为Add Location
anchor 文本为Add Job Field
anchor 文本为取消
anchor 文本为Add
anchor 文本可以
anchor 文字清晰
anchor 文本是保存此搜索
anchor 文本为单行
anchor 文本是保存此搜索
anchor 文本为取消
anchor 文本是访问我保存的搜索
anchor 文本为确认
anchor 文本为取消
anchor 文本可以
anchor 文本可以
anchor 文本可以
anchor 文本是您还可以查看所有可用的职位空缺。
anchor 文本是推荐 friend
anchor 文本是上一个
anchor 文本是下一个
anchor 文本可以
同样的方法为 https://healthfirst.taleo.net/careersection/hf_ext_cs/jobsearch.ftl?lang=en 提供了预期的结果我不知道为什么会这样,有人可以看看吗
最佳答案
您尝试检索的数据不是初始 html 的一部分,而是在页面加载后由 JavaScript 设置的。您可以通过在浏览器中禁用 JavaScript 来检查它。 Jsoup只获取静态html,不执行JavaScript代码。
Jsoup 目前不支持 JavaScript,这意味着使用 Jsoup 解析时将无法使用使用 JavaScript 加载数据的页面。
如果你想获取这种动态加载的数据,你可以:
-使用替代方案,例如 HtmlUnit、Selenium WebDriver 或 ui4j。
-使用网站的 API,如果它提供的话,
-要找出网站从何处加载其数据,通常您需要做的就是在某处发送 HTTP 请求以获取 JSON 格式的数据。
可以在这里找到更多详细信息: https://stackoverflow.com/tags/jsoup/info
或者您可以使用此答案中的提示: https://stackoverflow.com/a/50831894
关于javascript - 无法使用 Jsoup 找到一些 html 元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56221804/
我有一些像这样的 html: zip code 我的 Java 代码 Elements formElements = doc.getElementsByTag("form"); for(Ele
我无法使用 创建 session jsoup 以及如何使用 jsoup 发布数据.请帮助我,我是新来的 jsoup api ,实际上我的代码是: Connection.Response res = J
我想添加一个新的元标记 Document doc = Jsoup.parse(.....) doc.select("meta").first.appendElement("meta".attr("na
有没有办法用 Jsoup 保留新行,(不是 )? Document pdsc = Jsoup.connect("http://drafts.bestsiteeditor.com/promoters/d
我需要将 jsoup 元素映射回源 HTML 中的特定字符偏移量。换句话说,如果我有这样的 HTML: Hello World 我需要知道“Hello”从偏移量 0 开始,长度为 6 个字符,从偏移
我喜欢用 Jsoup 解析 html,但是他们的连接有问题,我需要将请求发送到同一个网站但不同的查询参数,比如“id=XXX”,请求是这样的: http://website/?id=XXX 我不想为每
我有代码,有点像这样 String str = " >foo< "; Document doc = Jsoup.parse(str, "", Parser.xmlParser()); 但
是否可以使用 jsoup 来验证 HTML 片段?我想知道标记是否格式错误,而不是让 jsoup 自动修复它,我希望能够通知用户自己修复源标记。 最佳答案 Jsoup 不是检查 xml 或 html
Jsoup 有 2 个 html parse() 方法: > parse(String html) - "由于没有指定基本 URI,绝对 URL检测依赖于包含标记的 HTML。” > parse(St
我正在尝试使用 jsoup 从此网页中提取所有图片网址?任何人都可以提供有关如何做到这一点的帮助吗?所有标签的格式都是这样的,但我只需要 src 图像,而不是 ajaxsrc: 链接在这里: htt
我试图找到所有 或 一页/文档中的标签。 我如何使用 OR运算符(operator)在 doc.select("div.name1 OR div.name2") ? 最佳答案 select metho
我为我的项目创建了一个新模块来添加一些额外的功能。在该模块中,我在模块的 Gradle 文件 implementation 'org.jsoup:jsoup:1.10.2' 中添加了 Jsoup 依赖
我正在寻找这个 div 中的主图像 我试过这个: Document document = Jsoup.connect(url).get(); Elements img = document.se
谁能解释一下 JSoup 中提供的 Element 对象和 Node 对象之间的区别? 在什么情况/条件下使用什么最好。 最佳答案 节点是 DOM 层次结构中任何类型对象的通用名称。 元素是一种特定类
有什么方法可以防止 Jsoup 的 HTML 解析器将单个标签(最具体的是 标签)转换为自闭合标签? 标签是有效的 HTML5 元素,但 Jsoup 一直将它们转换为 . 我在下面的链接中有一个示
可以屏蔽吗 Jsoup.connect("http://xyz.com").get().html(); 作为对网站的浏览器调用? 我尝试构建一个壁纸下载工具,但在从服务器下载页面时遇到问题。 如果我下
我希望在 Groovy 中开发一个网络爬虫(使用 Grails 框架和 MongoDB 数据库),它能够爬取网站,创建网站 URL 列表及其资源类型、内容、响应时间和所涉及的重定向数量。 我正在讨论
如果我有一个看起来像这样的元素: bar text 1 bar text 2 我已经有了 元素被选中,我想选择 元素是 的直接子元素但不是
任何人都可以提供有关我将如何解析超大 HTML 流/文件的指针或建议。例如,我有一个大约有 270,000 行的表,我想一次将它带入我的应用程序大约 20,000 行。 jsoup 解析方法允许使用
我收到此错误: java.lang.RuntimeException: An error occured while executing doInBackground() at and
我是一名优秀的程序员,十分优秀!