gpt4 book ai didi

用于删除 MSWord 生成的 HTML 标记的 Java 类

转载 作者:可可西里 更新时间:2023-11-01 13:40:20 26 4
gpt4 key购买 nike

一些 HTML 表单由用户使用 MSWord、FCK 编辑器或其他工具中的复制和粘贴来填写。这会生成讨厌的标签,使其他工具无法正常工作。有没有一种方法可以让服务器清理传入的参数,从而删除讨厌的 HTML 标记?

当然,正则表达式没什么用,只要用户能写就可以了。

我指的是专门从事这项工作的 Java 类。

例如,所有这些都可以用空字符串替换。

<p><!--[if gte mso 9]><xml><w:WordDocument><w:View>Normal</w:View><w:Zoom>0</w:Zoom><w:HyphenationZone>21</w:HyphenationZone><w:PunctuationKerning /><w:ValidateAgainstSchemas /><w:SaveIfXMLInvalid>false</w:SaveIfXMLInvalid><w:IgnoreMixedContent>false</w:IgnoreMixedContent><w:AlwaysShowPlaceholderText>false</w:AlwaysShowPlaceholderText><w:Compatibility><w:BreakWrappedTables /><w:SnapToGridInCell /><w:WrapTextWithPunct /><w:UseAsianBreakRules /><w:DontGrowAutofit /></w:Compatibility><w:BrowserLevel>MicrosoftInternetExplorer4</w:BrowserLevel></w:WordDocument></xml><![endif]--><!--[if gte mso 9]><xml><w:LatentStyles DefLockedState="false" LatentStyleCount="156"></w:LatentStyles></xml><![endif]--><!--[if gte mso 10]><style>/* Style Definitions */table.MsoNormalTable{mso-style-name:"Tabla normal";mso-tstyle-rowband-size:0;mso-tstyle-colband-size:0;mso-style-noshow:yes;mso-style-parent:"";mso-padding-alt:0cm 5.4pt 0cm 5.4pt;mso-para-margin:0cm;mso-para-margin-bottom:.0001pt;mso-pagination:widow-orphan;font-size:10.0pt;font-family:"Times New Roman";mso-ansi-language:#0400;mso-fareast-language:#0400;mso-bidi-language:#0400;}</style><![endif]--></p>

最佳答案

FCKEditor 有一个“从 word 粘贴”按钮,效果很好。您能否要求您的用户使用此功能?

关于用于删除 MSWord 生成的 HTML 标记的 Java 类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4128885/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com