gpt4 book ai didi

c - 当字符集为 ASCII 时,如何在文字字符串 ISO/ANSI C 中表示 Unicode 字符?

转载 作者:太空狗 更新时间:2023-10-29 17:16:18 26 4
gpt4 key购买 nike

在 Perl 中,我可以说

my $s = "r\x{e9}sum\x{e9}";

"résumé" 分配给 $s。我想在C中做类似的事情。具体来说,我想说

sometype_that_can_hold_utf8 c = get_utf8_char();
if (c < '\x{e9}') {
/* do something */
}

最佳答案

对于 UTF8,您必须使用找到的规则自行生成编码,例如 here .例如,德语升号 s(ß,代码点 0xdf)具有 UTF8 编码 0xc3,0x9f。您的 e-acute(é,代码点 0xe9)的 UTF8 编码为 0xc3,0xa9。

你可以在你的字符串中放入任意十六进制字符:

char *cv = "r\xc3\xa9sum\xc3\xa9";
char *sharpS = "\xc3\x9f";

关于c - 当字符集为 ASCII 时,如何在文字字符串 ISO/ANSI C 中表示 Unicode 字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1421811/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com