gpt4 book ai didi

java - 使用 Jsoup 替换所有不可预测组合 HTML 标签

转载 作者:行者123 更新时间:2023-11-30 02:45:43 24 4
gpt4 key购买 nike

我正在从网页获取 HTML 并尝试从中检索数据。

我有类似 <h3><strong>title</strong><h3> 的 HTML我想用 <h2> 替换。但是,有时我会在内容中发现意想不到的标签,例如:
<h3><br/><strong>title</strong></h3>

如何删除空的 html 标签,例如 <p><br></p><h3><br /><h3>来自字符串?

最佳答案

您始终可以尝试在元素上使用 jsoup 的 .text() 方法来仅获取文本,然后将该文本放入 h3 中。

关于java - 使用 Jsoup 替换所有不可预测组合 HTML 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40258848/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com