gpt4 book ai didi

java - jsoup.text() 和 jsoup.body().text() 的区别

转载 作者:行者123 更新时间:2023-12-01 12:43:49 27 4
gpt4 key购买 nike

使用 Jsoup 库,我试图从 HTML 字符串中获取内容(仅文本)。有两种方法可以给我内容:

Jsoup.parse(htmlString).body().text()
Jsoup.parse(htmlString).text()

我知道第一种方法只会返回正文的文本。第二种方法返回什么?哪一种更适合我的使用?

备注 : 根据文档, text 方法用于设置文档正文的文本

最佳答案

每个 Element 都有方法 text()

public java.lang.String text() Gets the combined text of this element and all its children. Whitespace is normalized and trimmed.



所有可以包含文本节点( node.nodeName() 返回#text)的元素都是 supposed to be part of the body ,除了 <title>标签( <script><style> 标签具有节点名称为#data 的子节点)。

因此,有效页面将为 document.body().text() 返回相同的文本。和 document.text() ,只要头部没有设置title标签,否则 document.text()将另外包含标题文本。

关于java - jsoup.text() 和 jsoup.body().text() 的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39444941/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com