gpt4 book ai didi

unicode - Unicode 中的 "non-surrogate Unicode code point"是什么意思?

转载 作者:行者123 更新时间:2023-11-29 08:01:38 25 4
gpt4 key购买 nike

在 Rust 中有一条规则说“取消引用原始指针必须产生一个适当的、非代理的 Unicode 代码点”。

我不明白这里的“非代理人”是什么意思。我所知道的是 UTF-8 具有可变长度的代码点,因此 Vec<u8>不能直接转为UTF-8,需要“padding”。

最佳答案

在 Unicode 中,从 U+D800 到 U+DFFF 的代码点称为代理。他们是reserved for use by UTF-16 ,并且您不得将它们用于其他任何用途。

Rust char 类型表示一个抽象代码点,并且不依赖于任何特定的编码,因此将 UTF-16 代理项存储在 char 中不会感觉。

关于unicode - Unicode 中的 "non-surrogate Unicode code point"是什么意思?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54263873/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com