gpt4 book ai didi

java - 如何使用 JSoup 或 HTMLCleaner 缩短 HTML 代码

转载 作者:行者123 更新时间:2023-12-02 03:06:24 25 4
gpt4 key购买 nike

大家好。我正在尝试将 HTML 代码保存在数据库中,并且我正在使用 SHEF(Swing HTML Editor Framework) ,但我有一个很大的问题。通常,生成的 HTML 是这样的:

<div>
This is the first paragraph
</div>
<div>
This is the second paragraph.
</div>
<div>
This is the last paragraph.
</div>

我想“清理”html 代码并使结果看起来像这样:

<div>
This is the first paragraph
<br>
This is the second paragraph.
<br>
This is the last paragraph.
</div>

我尝试使用 HTMLCleanerJSoup ,但我还没做到。我只能让 JSoup 工作,这样

<div>
This is the first paragraph
</div>
<div>

</div>
<div>
This is the last paragraph.
</div>

变成

<div>
This is the first paragraph
</div>
<br>
<div>
This is the last paragraph.
</div>

这是我使用的 JSoup 代码:

Document source = Jsoup.parse(sourceString);

// For each element
for(Element el: source.select("*")) {

if(el.children().isEmpty() && !el.hasText() && el.isBlock()) {
el.replaceWith(new Element(Tag.valueOf("br"), ""));//replace empty tags with newline
}
}
return source.body().html();

有什么办法可以让生成的 HTML 代码更短吗?谢谢!

最佳答案

我建议,不要摆弄 HTML 并试图最小化它,而是只需 gzip 压缩它并将其保存到数据库中(并在退出时膨胀)。

CPU 开销很小,并且节省的费用会高得多。而且你的代码会更简单、更通用。 HTML 的 gzip 通常提供 75%-80% 的压缩率,而删除一些标签会给你,什么,10%?

以下是如何 compress / decompress 的示例.

关于java - 如何使用 JSoup 或 HTMLCleaner 缩短 HTML 代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41676199/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com