gpt4 book ai didi

UTF-8 字符串分隔符

转载 作者:行者123 更新时间:2023-12-01 14:38:06 25 4
gpt4 key购买 nike

我正在解析一个二进制协议(protocol),其中散布在原始字节之间的 UTF-8 字符串。这个特定的协议(protocol)在每个 UTF-8 字符串前面加上一个短的(两个字节),表示后面的 UTF-8 字符串的长度。这给出了最大字符串长度 2^16 > 65 000,这对于特定应用程序来说已经足够了。

我的问题是,这是分隔 UTF-8 字符串的标准方法吗?

最佳答案

我不会称之为定界,更像是“长度前缀”。有些人称他们为Pascal strings因为在早期,Pascal 语言是在内存中以这种方式存储字符串的流行语言之一。

我认为没有专门针对此的正式标准,因为它是存储 UTF-8 字符串(或任何字节字符串)的一种相当明显的方式。但是,它被一遍又一遍地定义为处理包含字符串的消息的许多标准的一部分。

关于UTF-8 字符串分隔符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5847982/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com