gpt4 book ai didi

Unicode、UTF、ASCII、ANSI 格式差异

转载 作者:行者123 更新时间:2023-12-02 05:48:53 33 4
gpt4 key购买 nike

UnicodeUTF8UTF7UTF16UTF32<之间有什么区别ASCIIANSI 编码?

这些对程序员有什么帮助?

最佳答案

查看您的列表:

  • "Unicode "不是一种编码,但不幸的是,许多文档不精确地使用它来指代特定系统默认使用的任何 Unicode 编码。在 Windows 和 Java 上,这通常意味着 UTF-16;在许多其他地方,它表示 UTF-8。正确地说,Unicode 指的是抽象字符集本身,而不是任何特定的编码。
  • UTF-16 :每个“代码单元”2 个字节。这是 .NET 中字符串的 native 格式,通常在 Windows 和 Java 中也是如此。 Basic Multilingual Plane 之外的值(BMP) 被编码为代理对。这些过去相对很少使用,但现在许多消费者应用程序需要识别非 BMP 字符才能支持表情符号。
  • UTF-8 :可变长度编码,每个代码点 1-4 个字节。 ASCII 值使用 1 个字节编码为 ASCII。
  • UTF-7 :通常用于邮件编码。如果您认为自己需要它但没有处理邮件,那么您可能就错了。 (这只是我在新闻组等中发帖的经验 - 在邮件之外,它实际上根本没有被广泛使用。)
  • UTF-32 :每个代码点使用 4 个字节的固定宽度编码。这不是很有效,但使 BMP 之外的生活变得更轻松。我有一个 .NET Utf32String 类作为我的 MiscUtil 的一部分图书馆,如果你想要的话。 (请注意,它还没有经过非常彻底的测试。)
  • ASCII :仅使用底部 7 位的单字节编码。 (Unicode 代码点 0-127。)无重音符号等。
  • ANSI:没有一种固定的 ANSI 编码 - 有很多。通常,当人们说“ANSI”时,他们的意思是“我的系统的默认区域设置/代码页”,这是通过 Encoding.Default 获得的。 ,并且通常是 Windows-1252但也可以是其他语言环境。

还有更多关于my Unicode page的信息和 tips for debugging Unicode problems .

另一个重要的代码资源是 unicode.org其中包含的信息比您能够完成的信息要多 - 可能最有用的部分是 code charts .

关于Unicode、UTF、ASCII、ANSI 格式差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/700187/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com