gpt4 book ai didi

java - 适用于 HTML 的 Java 最佳 DOM API

转载 作者:行者123 更新时间:2023-12-01 23:36:25 25 4
gpt4 key购买 nike

当我需要使用使用 HttpURLConnection 代码检索的 HTML 文档时,什么是适合 Java 的良好 DOM api? 。我注意到jsoup除了作为 DOM 解析器之外,还可以进行一些 http 连接。有没有更好或更适合更复杂的http请求的东西?

最佳答案

用两句话来说,我的答案是:(A) 不要在应用程序设计中将网络连接与 DOM 解析混合在一起。 (B) 与 JSoup你已准备好出发。

以下是更多详细信息:

(A)我建议混合使用这两个要求 (1) DOM 解析和 (2) 处理 HTTP 连接。当然,我不知道你手头的情况,但你可能最终会得到一个不清晰的设计,这将很难维护。例如,如果您迁移到 HTTPS,您可能依赖于解析器能够处理它。

(B) 也就是说,如果您正在处理 HTML 文档,您可能会对不仅能够处理有效的 XHTML,而且能够处理不完整的标记更感兴趣。

stackoverflow 上还有其他相关问题(例如 thisthis ),可归结为以下工具:

  • 清理 HTML 页面以符合 XHTML,
  • DOM 解析,
  • 两者的结合。

最常用的工具似乎是

Here为了您的方便,还有一个开源 Java HTML 解析器的列表。

如果您仍然认为您的解析器应该处理 URL 连接,也许您可​​以指定更多有关“更复杂的 http 请求”含义的详细信息?

HTH

关于java - 适用于 HTML 的 Java 最佳 DOM API,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18615674/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com