gpt4 book ai didi

unicode - UTF-8 字符串中可以包含 NULL (0x0) 吗?

转载 作者:行者123 更新时间:2023-12-04 02:17:28 27 4
gpt4 key购买 nike

如果是这样,它是否允许在字符串中的任何位置?

最佳答案

是的,UTF-8 将 0x0 定义为 NUL .没有理由不能成为 UTF-8 流的一部分。 RFC 3629 专门涵盖了这种情况:

Character numbers from U+0000 to U+007F (US-ASCII repertoire) correspond to octets 00 to 7F (7 bit US-ASCII values). A direct consequence is that a plain ASCII string is also a valid UTF-8 string.



如您所知,有多种存储格式在编码 NUL 时遇到问题。 ,因此有修改过的 UTF-8,它提供了一种替代编码,但“未修改”的 UTF-8 要求将其编码为 0x0(将其编码为 C0 80 在第 10 节中明确称为非法 UTF-8)。

关于unicode - UTF-8 字符串中可以包含 NULL (0x0) 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33060368/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com