gpt4 book ai didi

vim - 如何修复错误的文本文件编码?

转载 作者:行者123 更新时间:2023-12-01 11:40:18 25 4
gpt4 key购买 nike

我有一个声称是 UTF-8 编码的文本文件。也就是说,当我调用 file -I $file 时它打印 $file: text/plain; charset=utf-8 .但是当我用 UTF-8 编码打开它时,一些字符似乎已损坏。也就是说,该文件假设是德语,但特殊的德语字符如 ö显示为 ö .

我猜测声称是 UTF-8 是错误的并执行了 enca脚本来猜测真正的编码。但遗憾的是 enca 告诉我语言 de (德语) 不受支持。

还有其他方法可以修复文件吗?

最佳答案

“ö”U+00F6 的 UTF-8 编码形式是 0xC3 0xB6,如果这些字节在 ISO-8859-1 中解释,它们就是“ö”(U+00C3 U+00B6)。因此,要么文件实际上被读取并解释为 ISO-8859-1,即使您另有预期,要么存在双重编码:以前,文件或其部分已被读取,就好像它是 ISO-8859-1 (即使它是 UTF-8),然后被误解的数据被写出为 UTF-8 编码。

关于vim - 如何修复错误的文本文件编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21735815/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com