gpt4 book ai didi

c++ - (C++)。非unicode语言(简体中文)输入/输出

转载 作者:行者123 更新时间:2023-11-28 06:05:46 25 4
gpt4 key购买 nike

我是编程新手,正在处理我的 C++ 教科书中的一些示例。我能够完成大部分示例,但是当我尝试执行以下操作时出现了一些问题:尝试在类似于“Hello World!”的程序上显示中文字符

  1. 关于简体中文等非unicode字符的输入/输出问题,我想提供一些我目前尝试过的信息:

    我正在运行“Hello world!” Code:Blocks 上的程序使用 C++ 并试图用汉字“你好”替换文本“Hello world”。我运行了程序,但在命令提示符下输出只是乱码(乱码)。于是,上网查了资料,发现必须把区域设置改成“简体,中国”。我这样做了,重新启动了我的电脑并再次运行了程序。这一次,程序的输出是非 unicode 字符,但是,它们是不正确的字符(这些:搓犲ソ锛)我也相信它也是日语......互联网上的一些中文资源说明了这一点成为“你好”的编码,但我不太确定。我只想让我写在后面的文本 (std::cout << "---\n";) 像我使用英语时一样正确显示。我怎样才能让它显示我在 Code:Block 中在命令提示符下写的内容?

最后,因为我使用了非法字符,弹出了一个提示,说编码被更改了...

最佳答案

尝试了以下方法:

#include <iostream>

int main()
{
std::cout << "你好" << std::endl;
return 0;
}

我得到了输出:

你好

这对我来说似乎是相同的字符(如果我没有看到你做的不同,我谦虚地道歉)。这让我认为问题在于一方面保存文件和/或编译时字符到字节的转换与执行期间显示字节到字符的转换不匹配。

我的正确输出是在 XUbuntu 上使用 g++ 4.8.4。 cpp 文件是用 vim 保存的,看起来像这样:

 00000000:  23 69 6e 63 6c 75 64 65  20 3c 69 6f 73 74 72 65  #include <iostre
00000010: 61 6d 3e 0a 0a 69 6e 74 20 6d 61 69 6e 28 29 0a am>..int main().
00000020: 7b 0a 09 73 74 64 3a 3a 63 6f 75 74 20 3c 3c 20 {..std::cout <<
00000030: 22 e4 bd a0 e5 a5 bd 22 20 3c 3c 20 73 74 64 3a "......" << std:
00000040: 3a 65 6e 64 6c 3b 0a 09 72 65 74 75 72 6e 20 30 :endl;..return 0
00000050: 3b 0a 7d 0a -- -- -- -- -- -- -- -- -- -- -- -- ;.}.------------

如您所见,每个字符都保存为 3 个字节的 UTF-8 序列(编码位以粗体显示):

  • 你 — 11100100 10111101 10100000 — 字符 77664
  • 好 — 11100101 10100101 10111101 — 字符 22909

因为你有一次得到 4 个字符的文本,我相信这些字节实际上以某种方式被编译为 UTF-8 就好了,但随后被读取为其他东西。如果它们被读取为 UTF-16,那将尝试生成 3 个字符(每个字符 2 个字节),但这不太可能发生,因为标准的创建方式是为了避免这种混淆,而且还因为你实际上得到了4个字符,UTF-16不可能用不到2个字节来生成一个字符。

此时我必须说我没有足够的信息来尝试进一步帮助您。请考虑提供您尝试编译的确切代码,如果可能,还提供它的十六进制表示形式。

关于c++ - (C++)。非unicode语言(简体中文)输入/输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32447997/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com