gpt4 book ai didi

encoding - 为什么会有不同的编码类型?

转载 作者:行者123 更新时间:2023-12-03 20:11:02 27 4
gpt4 key购买 nike

这是一个菜鸟问题,但我想知道为什么会有不同的编码类型,它们之间有什么区别(即ASCII,utf-8和16,base64等)。

最佳答案

我相信有很多原因,但主要要点是:“您需要显示(编码)多少个字符?”例如,如果您居住在美国,则使用ASCII可能会走得更远。但是在许多县,我们需要ä,å,ü等字符(如果SO仅是ASCII,或者您尝试将此文本读取为ASCII编码文本,则在ä,å和ü处会看到一些奇怪的字符。 )还要考虑中国,日本,泰国和其他“异国”县。您可能在世界各地看到的照片上那些奇怪的数字可能只是字母,而不是漂亮的图片。

至于不同编码类型之间的差异,您需要查看其规范。这是UTF-8的东西。


http://www.unicode.org/standard/standard.html
http://www.utf-8.com/
http://en.wikipedia.org/wiki/UTF-8#Compared_to_other_multi-byte_encodings


我对UTF-16不熟悉。以下是有关差异的一些信息。


http://en.wikipedia.org/wiki/Unicode
http://en.wikipedia.org/wiki/Unicode_plane


当需要对二进制数据进行编码时需要使用Base64,该二进制数据需要通过旨在处理文本数据的媒体进行存储和传输。如果您曾经使用PHP制作过某种电子邮件系统,则可能遇到过Base64。


http://en.wikipedia.org/wiki/Base64
http://www.phpeveryday.com/articles/PHP-Email-Using-Embedded-Images-in-HTML-Email-P113.html


简短:支持计算机程序的用户界面本地化为多种不同的语言。 (编程语言仍然主要由ASCII编码中的字符组成,尽管例如在Java中可以在变量名中使用UTF-8编码,并且源代码文件通常以ASCII编码文本之外的其他形式存储,例如UTF 8种编码。)

简而言之,第2卷:总是在不同的人试图从特定的角度解决某些问题时(或者甚至在没有观点的情况下,即使有可能),结果也可能会大不相同。引用乔尔(Joel)的unicode文章(下面的链接)的话:“因为字节最多可以容纳8位,所以很多人开始思考,“天哪,我们可以出于自己的目的使用代码128-255。”问题是,很多的人同时有这个想法,他们对从128到255的空间应该去哪里有自己的想法。”

感谢Joachim和tchrist提供的所有信息和讨论。这是我刚刚阅读的两篇文章。 (这两个链接都在我之前链接的页面上。)自从几年前我上一次阅读以来,我已经忘记了Joel文章中的大部分内容。我希望对这个主题有很好的介绍。马克·戴维斯走得更深。


http://www.joelonsoftware.com/articles/Unicode.html
http://www.icu-project.org/docs/papers/forms_of_unicode/

关于encoding - 为什么会有不同的编码类型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10088473/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com