gpt4 book ai didi

java - 为什么 Jsoup 不能解析 tagName "link"

转载 作者:行者123 更新时间:2023-11-29 04:47:03 24 4
gpt4 key购买 nike

我的 Jsoup 项目中有这个有线 senario

这是 HTML 的样子:

<html>
..

<link> example.com </link>
..

</html>

当我尝试使用 Jsoup 时获取文本

System.out.println(document.select("link").text()) ;//nothing gets printed. (it should print **example.com**)

但如果我将 html 更改为:

<html>
..

<someOtherTage> example.com </someOtherTage>
..

</html>

然后:

System.out.println(document.select("someOtherTage").text()); //prints **example.com**

所以我的问题:

这是 Jsoup 中的错误还是标签名称“link”有什么特别之处?

注意:Jsoup 版本使用 1.6 和 1.9。 Java 7 和 8

最佳答案

因为 link 元素是一个 empty element ,JSoup 已经清理了元素并将其内容移动到正文中。 (通过打印文档来验证这一点)。

要保留链接元素中的内容,切换到XML解析模式:

Document doc = Jsoup.parse(html, "", Parser.xmlParser());

关于java - 为什么 Jsoup 不能解析 tagName "link",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36739950/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com