gpt4 book ai didi

Emacs - 如何避免或替换错误的字符编码?

转载 作者:行者123 更新时间:2023-12-04 05:42:39 25 4
gpt4 key购买 nike

假设我收到用 MS word 编写的西类牙语文本并保存为纯文本 (.txt)。不幸的是,所有的西类牙口音都是这样显示的:

Un \372ltimo an\341lisis

谁能告诉我如何避免这种情况,或者至少如何替换这些字符?替换正则表达式函数根本找不到它们,否则我可以编写一个小的 elisp 函数,用相关的西类牙重音字符替换它们的每次出现。

最佳答案

这看起来像 ISO 8859-1 (Latin-1) 编码。

而是使用该编码系统访问该文件。如果 Emacs 没有自动识别编码系统,您可以使用 revert-buffer-with-coding-system 使用显式编码系统重新访问该文件。 ( C-x RET r )。

例如,如果您正在查看您描述的乱码文件,

C-x RET r
latin-1 RET
yes RET

然后你可以设置你想要保存的编码系统( C-x RET f )并指定类似 utf-8 的内容.

关于Emacs - 如何避免或替换错误的字符编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11073003/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com