gpt4 book ai didi

java - 使用 JSoup 清理 html 时保持样式

转载 作者:行者123 更新时间:2023-11-28 01:48:27 25 4
gpt4 key购买 nike

我是 JSoup 的新手。而且,我正在使用以下代码来清理 html:

    String clean = Jsoup.clean(html, Whitelist.relaxed());

我得到了所需的 html,但缺少所有样式,例如粗体、斜体等。

我如何使用 JSoup 维护 html 代码及其各自的样式?如果还有其他图书馆可以这样做,请给我推荐一个?

最佳答案

当你使用 Jsoup.clean(html, Whitelist.relaxed()) 时,

Whitelist.relaxed()

直接来自文档,

This whitelist allows a full range of text and structural body HTML: a, b, blockquote, br, caption, cite, code, col, colgroup, dd, dl, dt, em, h1, h2, h3, h4, h5, h6, i, img, li, ol, p, pre, q, small, strike, strong, sub, sup, table, tbody, td, tfoot, th, thead, tr, u, ul

如果你想允许更多元素(即样式属性)将它们添加到 Whitelist 实例以允许通过它。您可以使用 Whitelist API 中的以下方法

addTags(java.lang.String...)
addAttributes(java.lang.String, java.lang.String...)

请阅读 Whitelist 的文档来自 JSOUP 库。

关于java - 使用 JSoup 清理 html 时保持样式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21325608/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com