gpt4 book ai didi

php - 从 Word 文档中清除 HTML

转载 作者:行者123 更新时间:2023-11-29 14:09:04 27 4
gpt4 key购买 nike

好的,我的公司有一个客户端,它有一个用于发布内容的界面 - 标准 MySQL 数据库、基于 PHP 的数据库等。

无论如何,他们不断地让实习生或某人直接从 MS Word 文档将内容发布到此界面 - 该界面编码很差,并且按原样接受此输入,没有任何格式。

我的公司现在已被外包来解决这个特定问题,因为它不断破坏他们的网站,并且我的公司多次不得不手动进入数据库,并删除有问题的值。

是否有一种快速且简单的方法可以做到这一点,或者我是否必须对每个有问题的字符进行替换操作?

我发现 htmlentities() 可能是部分解决方案 - 但据我所知,这不会删除所有内容。

有什么好的办法可以解决这个问题吗?有什么办法可以让这件事变得更容易吗?

我们也在考虑编写一个内容验证器,可能只是服务器端(尽管可能是客户端,如果我这一周过得足够慢/我足够快地完成剩下的部分)。

最佳答案

这取决于您支持的客户(或潜在客户)数量以及您需要投入多少时间。选项

  • 编写您自己的函数来删除元数据

  • 教您的客户自行删除它,例如先粘贴到记事本中,
    或者提供知识库文章来解释如何在软件中执行此操作。也许他们可以点击“帮助”部分或图标。http://support.microsoft.com/default.aspx?scid=kb;en-us;223396

  • 使用所见即所得编辑器(例如 TinyMCE)来删除它

但是正如我在评论中所说,除非你使用的是自己的函数,否则请做好让客户继续直接粘贴并想知道为什么会出现问题的准备。

关于php - 从 Word 文档中清除 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13808136/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com