gpt4 book ai didi

unicode - 大写 utf8 字符是否总是与其小写变体的字节数相同?

转载 作者:行者123 更新时间:2023-12-04 05:53:53 30 4
gpt4 key购买 nike

显然,拉丁字母表也是如此。但我是在概念上提出这个问题,跨越语言和 Unicode 规范。

实际上,这是为了比较两个字符串。如果你已经知道它们的字节数不同——在所有语言中——你能认为这足以保证它们不是同一字符串的不同“大小写”版本吗?

最佳答案

不。

考虑 U+0069 "i"其八位字节值 69在 UTF-8 中。在大写形式 U+0130 "İ"中,此代码点形成 UTF-8 序列 C4 B0 .

强制性说明:区分大小写的区域设置。

关于unicode - 大写 utf8 字符是否总是与其小写变体的字节数相同?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14792841/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com