gpt4 book ai didi

c++ - std::string 与 unicode 的奇怪行为

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:34:22 26 4
gpt4 key购买 nike

我有以下代码:

#include <iostream>

std::string eps("ε");

int main()
{
std::cout << eps << '\n';
return 0;
}

它以某种方式在 Ubuntu 上用 g++ 和 clang 编译,甚至打印出正确的字符 ε。我也有几乎相同的一段代码,它愉快地将 εcin 读入 std::string。顺便说一下,eps.size() 是 2。

我的问题是 - 它是如何运作的?我们如何将 unicode 字符插入到 std::string 中?我的猜测是操作系统使用 unicode 处理所有这些工作,但我不确定。

编辑

对于输出,我知道是终端负责向我显示正确的字符(在本例中为 ε)。

但是对于输入:cin 将符号读取为 ' ' 或任何其他空格字符(据我所知,逐字节)。因此,如果我采用 ş,第二个字节是 32 ' ',它将只读取第一个字节,然后停止。但它显示为 ş。怎么办?

最佳答案

最可能的原因是所有内容都在 UTF-8 中编码,就像在我的系统上一样:

$ xxd test.cpp
...
0000020: 2065 7073 2822 ceb5 2229 3b0a 0a69 6e74 eps("..");..int
^^^^ ε in UTF-8 ^^ TWO bytes!
...
$ g++ -o test.out test.cpp
$ ./test.out
ε
$ ./test.out | xxd
0000000: ceb5 0a
^^^^

关于c++ - std::string 与 unicode 的奇怪行为,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27462766/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com