gpt4 book ai didi

unicode - 什么是统一码?以及编码如何工作?

转载 作者:行者123 更新时间:2023-12-04 11:39:33 25 4
gpt4 key购买 nike

关闭。这个问题需要更多focused .它目前不接受答案。












想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post .

8年前关闭。




Improve this question




几个小时前,我正在阅读一本 C 编程书。当我阅读这本书时,我遇到了这些词,字符编码和 Unicode。然后我开始在谷歌上搜索有关 Unicode 的信息。然后我才知道 Unicode 字符集包含来自每种语言的每个字符和 UTF-8 ,16,32 可以对 中列出的字符进行编码unicode 字符集。

但我无法理解它是如何工作的。
unicode 是否取决于操作系统?
它与软件和程序有什么关系?
UTF-8 是我安装操作系统时安装在我电脑上的软件吗?
还是和硬件有关?
以及计算机如何编码这些东西?

我发现它非常令人困惑。请详细回答我。
我是这些东西的新手,所以在你给我答案时请记住这一点。

谢谢你。

最佳答案

我在 What Every Programmer Absolutely, Positively Needs To Know About Encodings And Character Sets To Work With Text 中对此进行了广泛的讨论。 .这里有一些亮点:

  • 编码很丰富,编码定义了如何将像“A”这样的“字符”编码为位和字节
  • 大多数编码只为少数选定的字符指定这一点;例如,写英语或捷克语所需的所有(或至少大部分)字符;单字节编码通常支持最多 256 个字符的集合
  • Unicode 是一项大型标准工作,它为使用中的每种主要语言的几乎所有字符和符号编目并指定了数字⟷ 字符关系,即数十万个字符
  • UTF-8、16 和 32 是如何将这个庞大的数字目录编码为字节的不同子标准,每个子标准都有不同的大小权衡
  • 软件需要专门支持 Unicode 及其 UTF-* 编码,就像它需要支持任何其他类型的专门编码一样;现在大部分工作都是由操作系统完成的,它向应用程序公开支持功能
  • 关于unicode - 什么是统一码?以及编码如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17512163/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com