gpt4 book ai didi

java - JSoup 解析带有未闭合标签的无效 HTML

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:48:47 25 4
gpt4 key购买 nike

使用包含最新版本 1.7.2 的 JSoup 存在一个错误,即解析带有未闭合标签无效 HTML。

例子:

String tmp = "<a href='www.google.com'>Link<p>Error link</a>";
Jsoup.parse(tmp);

生成的文档是:

<html>
<head></head>
<body>
<a href="www.google.com">Link</a>
<p><a>Error link</a></p>
</body>
</html>

浏览器会生成如下内容:

<html>
<head></head>
<body>
<a href="www.google.com">Link</a>
<p><a href="www.google.com">Error link</a></p>
</body>
</html>

Jsoup 应该作为浏览器或源代码工作。

有什么解决办法吗?查看 API,我没有找到任何东西。

最佳答案

正确的行为是在解析这个无效的 HTML 时充当其他浏览器。感谢您提交此 bug .我已经解决了阻止收养机构将原始属性保留在新节点中的问题。它将在 1.7.3 中可用,或者您现在可以从 head 构建。

关于java - JSoup 解析带有未闭合标签的无效 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15813821/

25 4 0