gpt4 book ai didi

encoding - 如何纠正文件的字符编码?

转载 作者:行者123 更新时间:2023-12-02 18:59:23 24 4
gpt4 key购买 nike

我有一个 ANSI 编码的文本文件,该文件不应该被编码为 ANSI,因为有重音符号ANSI 不支持的字符。我宁愿使用 UTF-8。

数据能否正确解码或在转码过程中丢失?

我可以使用哪些工具?

这是我所拥有的示例:

ç é

我可以从上下文(咖啡馆应该是咖啡馆)看出,这应该是这两个字符:

ç é

最佳答案

使用 Notepad++ 执行以下步骤

1-复制原文

2- 在 Notepad++ 中,打开新文件,更改编码 -> 选择您认为原始文本遵循的编码。也尝试编码“ANSI”,因为有时 Unicode 文件会被某些程序读取为 ANSI

3-粘贴

4-然后通过再次访问同一菜单来转换为 Unicode:编码 ->“以 UTF-8 编码”(而不是“转换为 UTF-8”),希望它将变得可读

上述步骤适用于大多数语言。您只需在粘贴到 Notepad++ 之前猜测原始编码,然后通过同一菜单转换为替代的基于 Unicode 的编码,看看内容是否变得可读。

大多数语言都存在两种编码形式: 1- 大多数计算机最初使用旧的 ANSI (ASCII) 形式,只有 8 位。 8 位仅允许 256 种可能性,其中 128 种是常规拉丁字符和控制字符,最后 128 位的读取方式不同,具体取决于 PC 语言设置 2- 新的 Unicode 标准(最多 32 位)为每个字符提供唯一的代码以所有当前已知的语言以及 future 更多的语言。如果文件是 unicode,则任何安装了该语言字体的 PC 都应该可以理解该文件。请注意,即使 UTF-8 也达到 32 位,并且与 UTF-16 和 UTF-32 一样广泛,只是它尝试保留带有拉丁字符的 8 位,只是为了节省磁盘空间

关于encoding - 如何纠正文件的字符编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/132318/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com