gpt4 book ai didi

html - 你如何处理MS Word添加的 "special"字符?

转载 作者:太空狗 更新时间:2023-10-29 13:35:50 25 4
gpt4 key购买 nike

我想知道您如何清除 MS Word 中的特殊字符,例如 m 和 n 破折号以及弯引号?

我经常发现自己从客户端从 Word 复制内容并粘贴到静态 HTML 页面,但内容以奇怪的字符结尾,因为特殊字符未转换为正确的 ACSII 代码,因此显示为乱码文本。 (对于这些基本网站,我使用的是 Dreamweaver。)

当客户将内容从 Word 复制到纯文本字段(主要是文本区域)时,我看到了很多类似的问题。当我将其放入 PDF(通过 PHP)或它显示在页面上时,它也有乱码文本。

你如何处理这个问题?是否有您使用的清洁服务或程序?

最佳答案

关于在文本区域中从 Word 复制/粘贴文本的客户:

确保客户端以任何特定编码向您发送文本(因此希望为您从 CP-1252 [或任何 Word 使用] 进行任何转换)的最可靠方法是添加 accept-charset="..."归属于你所有的<form>秒。例如:

<form ... accept-charset="UTF-8">
...
</form>

大多数浏览器都会遵守这一规定,并确保任何“特定于 Word 的”字符在到达您的网站之前都已转换为适当的字符集。

一旦无效文本到达您的网站,您几乎无法可靠地修复它,因此最好简单地检查所有输入在您使用的任何字符集中是否有效,并丢弃任何包含无效文本的请求。即使使用 accept-charset 也是必要的,因为毫无疑问,有些客户会忽略它。

关于html - 你如何处理MS Word添加的 "special"字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/832020/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com