gpt4 book ai didi

windows - 在 Windows 中识别 unicode 编码文本文件的最佳方法是什么?

转载 作者:可可西里 更新时间:2023-11-01 12:31:51 24 4
gpt4 key购买 nike

我正在开发一个代码库,由于多个团队成员使用不同的编辑器(和默认设置)进行开发,该代码库中散布着一些 unicode 编码的文件。我想通过查找所有 unicode 编码文件并将它们转换回 ANSI 编码来清理我们的代码库。

任何关于如何完成此任务的“发现”部分的想法都将不胜感激。

最佳答案

参见 “How to detect the character encoding of a text-file?”“How to reliably guess the encoding [...]?”

  • 可以通过验证检测到 UTF-8。您也可以查找 BOM EF BB BF,但不要依赖它。
  • 可以通过查找 BOM 来检测 UTF-16。
  • UTF-32 可以通过验证或 BOM 检测到。
  • 否则假定为 ANSI 代码页。

Our codebase doesn't include any non-ASCII chars. I will try to grep for the BOM in files in our codebase. Thanks for the clarification.

好吧,这让事情变得很多简单了。没有非 ASCII 字符的 UTF-8 ASCII。

关于windows - 在 Windows 中识别 unicode 编码文本文件的最佳方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4672659/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com