gpt4 book ai didi

java - 如何获取 HTML 的内容

转载 作者:行者123 更新时间:2023-11-30 05:14:50 25 4
gpt4 key购买 nike

当我有 html 时:

<html>
<head>
</head>
<body>
text
<div>
text2
<div>
text3
</div>
</div>
</body>
</html>

如何使用 DOM 解析器获取正文的 JAVA 内容: text
<div>
text2
<div>
text3
</div>
</div>
因为方法 getTextContent 返回:text text2 text3。 - 所以没有标签。

SAX 可以,DOM 也可以吗?

最佳答案

getTextContent 的行为符合我的预期 - 获取 HTML 片段的文本内容。您可以检查 DOM 解析器的 API 文档,看看是否有名称类似 getHtmlContent 的类似方法?

关于java - 如何获取 HTML <body> 的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1953156/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com