gpt4 book ai didi

Unicode 代码点限制

转载 作者:行者123 更新时间:2023-12-03 13:25:35 27 4
gpt4 key购买 nike

如解释 here , 所有 unicode 编码都以最大代码点结束 10FFFF但我听过不同的说法
它们最多可以达到 6 个字节,是真的吗?

最佳答案

UTF-8 在其生命周期中经历了一些变化,并且有许多规范(现在大部分已经过时)对 UTF-8 进行了标准化。大多数更改都是为了帮助与 UTF-16 兼容并允许不断增长的代码点数量。

长话短说,UTF-8 最初被指定为允许最多 31 位(或 6 个字节)的代码点。但与 RFC3629 ,这减少到最多 4 个字节。以更兼容 UTF-16。

维基百科还有更多 information . Universal Character Set的规范与 Unicode 的历史及其转换格式 (UTF) 密切相关。

关于Unicode 代码点限制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4983196/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com