gpt4 book ai didi

java - 如何使用 GWT 优化从 MS Word 复制的 HTML 文本?

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:57:17 24 4
gpt4 key购买 nike

我遇到了 RichTextArea 的问题,所以我的问题是:当我将从 Ms Word 或 OpenOffice 复制的文本粘贴到 RichTextArea 时,它保留了所有文本样式,这是完美的,但一个坏处是它的 HTML 文本足够大:(。由于不必要的 HTML 标记,数据库的大小不断增加。

我的问题是:“如何轻松优化 HTML 文本?”

谢谢!!!

最佳答案

RichTextArea是基于浏览器的contentEditable支持。这意味着您最终得到的 HTML“标签汤”将是特定于平台、源和浏览器的。当您说“优化”时,您的最终目标是什么?您要保留多少原始格式?除了对粘贴的 HTML 进行微不足道的缩小之外,HTML 复杂性的任何显着降低都可能导致视觉保真度下降。

实用程序,例如 HTML Tidy或其任何衍生物可能会在缩小方面帮助您。如果您的目标是降低 HTML 的复杂性,您可以考虑使用 HTMLUnit作为俘虏,服务器端浏览器在内存中呈现粘贴的内容,然后从 HTMLUnit 的 DOM 中提取您认为有用的属性。 FWIW,这是使 AJAX 应用程序可被搜索引擎抓取的一种方法。

虽然降低视觉保真度可能会让原始用户感到有些不安,但它确实为您提供了统一所有粘贴内容的视觉风格的机会。如果您基于许多用户的贡献构建网站,这种同质性会减少定位(即看到您所看到的)内容所需的脑力劳动。

关于java - 如何使用 GWT 优化从 MS Word 复制的 HTML 文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6161911/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com