gpt4 book ai didi

c - Unicode 转义序列与十六进制值

转载 作者:行者123 更新时间:2023-11-30 14:55:37 27 4
gpt4 key购买 nike

为了在程序中对 Unicode/UTF-8 字符进行编码,我一直在使用 \uXXXX 转义序列,例如:

wchar_t superscript_4 = L'\u2074';  // U+2074 SUPERSCRIPT 4 '⁴'
wchar_t subscript_4 = L'\u2084'; // U+2084 SUBSCRIPT 4 '₄'

但是,使用十六进制应该可以正常工作,因为 Unicode 是用十六进制编码的。

wchar_t superscript_4 = 0x2074;
wchar_t subscript_4 = 0x2084;

第二个示例能否正确编码字符?我会遇到宽字符问题、段错误或错误存储的字符值吗?如果是这样,为什么?如果不是,为什么?

最佳答案

可以使用十六进制常量初始化它们,但您也可以使用数字常量初始化普通的char,例如char c = 67;。它的工作原理是一样的;它分配任何 charwchar_t 具有该 int 的值。在你给出的例子中,假设一个 Unicode 执行环境(不能完全保证,但很有可能),它是下标或上标 4;在我的示例中,它是大写的 C

In particular ,对于常规 char,从技术上讲,像 'C' 这样的字符常量具有 int 类型,并且您通常分配 int > 值转换为 char。对于 wchar_t 来说,常量实际上具有 wchar_t 类型,并且整数值与调用 mbtowc 获得的值相同。 。因此,假设您在 Unicode 环境中工作,十六进制常量相当于 Unicode 转义。

不过,通常你不想这样做;使用字 rune 字可以更清楚地表达您的意图。如果您在源代码中使用非 ASCII 字符,则尤其如此,在这种情况下,您可以使代码为

wchar_t superscript_4 = L'⁴'
wchar_t subscript_4 = L'₄'

另请注意,对于许多用途,最好使用 char16_tchar32_t,因为 wchar_t 在不同平台上可以有不同的宽度;在您有特定需要切换到其他内容之前,仅使用 UTF-8 也可能会更干净。

关于c - Unicode 转义序列与十六进制值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45683179/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com