gpt4 book ai didi

java - 提取从 xml 解析的 html 标签之间的文本

转载 作者:行者123 更新时间:2023-12-02 08:19:29 34 4
gpt4 key购买 nike

谁能帮我将 html 标签中的文本提取为纯文本吗?

我已经解析了一个 xml 并获得了一些输出作为正文,其中包含 html 标签,现在我想删除标签并使用文本。

提前致谢!!!!

最佳答案

您可以使用 HTML 解析器,如 JSoup

例如HTML 是

<div style="height:240px;"><br>test: example<br>test1:example1</div>

您可以使用以下方式获取 html

Document document = Jsoup.parse(html);
Element div = document.select("div[style=height:240px;]").first();
div.html();

关于java - 提取从 xml 解析的 html 标签之间的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5743286/

34 4 0