c++ - 避免/设置 std::cout/std::cerr 的字符集转换/编码-6ren

c++ - 避免/设置 std::cout/std::cerr 的字符集转换/编码

转载作者：塔克拉玛干更新时间：2023-11-03 07:09:35

24

4

一般问题

写入std::cout时是否有可能避免字符集转换？/std::cerr ？我做了类似的事情

std::cout << "Ȋ'ɱ ȁ ȖȚƑ-8 Șțȓȉɳɠ (in UTF-8 encoding)" << std::endl;

我希望将输出写入维护 UTF-8 编码的控制台(我的控制台使用 UTF-8 编码，但我的 C++ 标准库 GNUs libstdc++ 出于某种原因不这么认为)。

如果没有可能禁止字符编码转换:我可以设置std::cout吗？使用 UTF-8，所以它希望自己知道不需要转换？

背景

我使用了 Windows API 函数 SetConsoleOutputCP(CP_UTF8);将控制台的编码设置为 UTF-8。问题似乎是 UTF-8 与通常用于我的系统区域设置和 libstdc++ 的代码页不匹配。因此设置std::cout使用默认的 ANSI 代码页而不是正确识别开关。

编辑:原来我误解了这个问题，而解决方案实际上要简单得多(或者不是......)。

"Ȋ'ɱ ȁ ȖȚƑ-8 Șțȓȉɳɠ (in UTF-8 encoding)"只是用作占位符(我不应该使用它，因为它隐藏了实际问题)。

在我的真实代码中，“UTF-8 字符串”是一个 Glib::ustring ，根据定义，它们是 UTF-8 编码的。但是我没有意识到输出运算符 <<是defined in glibmm以强制字符集转换的方式。
它使用 g_locale_from_utf8()在内部又使用 g_get_charset() 确定目标编码。

不幸的是 g_get_charset() 的文档州

On Windows the character set returned by this function is the so-called system default ANSI code-page. That is the character set used by the "narrow" versions of C library and Win32 functions that handle file names. It might be different from the character set used by the C library's current locale.

这只是意味着 glib 既不会关心我设置的 C 语言环境，也不会尝试确定我的控制台实际使用的编码，并且基本上不可能使用许多 glib 函数来创建 UTF-8 输出。 (事实上，这也意味着这个问题与触发我的另一个问题的原因完全相同:Force UTF-8 encoding in glib's "g_print()")。

我目前正在考虑这是 glib 中的一个错误(或者充其量是一个严重的限制)，并且可能会在问题跟踪器中为此打开一个报告。

最佳答案

你看错了，因为你在谈论一个字符串文字，包含在你的源代码中(而不是从你的键盘输入)，为了让它正常工作你必须告诉编译器正在使用哪种编码用于所有这些字符(我认为第一个提到非 ascii 字符集的 c++ 规范是 c++11)

因为您实际使用的是 UTF 字符集，所以您应该至少将它们全部编码为 wchar_t 才能被视为这样，或者在翻译器中达成一致(可能会发生这种情况)当用作字符串文字时，UTF 字符将采用 UTF-8 编码。这通常意味着它们将以 UTF-8 格式打印，如果您使用符合 UTF-8 标准的控制台设备，它们将可以正常打印，没有任何其他问题。

我知道有一个 gcc 选项可以指定源文件的字符串文字中使用的编码，clang 中也应该有另一个选项。检查文档，这可能会解决任何问题。但最好的可移植性是不依赖于代码集或使用像 ISO-10646 这样的代码集(但要知道完整的 utf 覆盖范围不仅是 utf-8，utf-8 只是一种方式编码 UTF 字符，因此，它只是表示 UTF 字符的一种方式)

另一个问题是，C++11 不引用 UTF 联盟标准，而是引用 ISO 对应标准(我认为是 ISO-10646)，两者相似但不相等，字符编码相似, 但不相等(例如，ISO 的代码大小为 32 位，而 Unicode 联盟的代码大小为 21 位)。它们之间的这些差异和其他差异使得在 C++ 中使用一些技巧并在考虑严格的 Unicode 时产生问题。

当然，要在 UTF-8 终端上输出正确的字符串，您必须先将 UTF 代码编码为 utf-8 格式，然后再将它们发送到终端。这是真的，即使您已经在字符串对象中将它们编码为 utf-8。如果你说它们已经是 utf-8 那么根本不会进行任何转换......但是如果你不说，通常的考虑是你使用的是普通的 utf 代码(但限制为 8bit代码)，将自己限制为八位代码，并在打印前将它们编码为 utf-8...这会导致编码错误(双重编码)，如 ú(unicode code \u00fa ) 应该用 utf-8 编码为字符序列 { 0xc3, 0xba };，但是如果你不说字符串文字确实是 utf-8，那么这两个字符都会被处理为 Â(\u00c3) 和 º(\u00ba) 字符的两个字符代码，并且将被重新编码为 { 0xc3, 0x83, 0xc2, 0xba }; 这将错误地显示它们。这是非常常见的错误，当某些编码不正确时，您应该已经看到了。样本来源here .

关于c++ - 避免/设置 std::cout/std::cerr 的字符集转换/编码，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43925932/

24

4

0

文章推荐： c++ - 修改无窗口 QLabel 的 alpha channel 透明度

文章推荐： c++ - 重载 + 运算符以添加分数

文章推荐： c++ - doxygen 生成供机器读取的文档

文章推荐： c++ - 按 'enveloping' 或 'dominance' 标准排序坐标

c++ - 将迭代器存储到字符串中(转换、转换、追加？)
我正在尝试将一个字符串逐个字符地复制到另一个字符串中。目的不是复制整个字符串，而是复制其中的一部分(我稍后会为此做一些条件......) 但我不知道如何使用迭代器。你能帮帮我吗？ std::stri
C++:转换/转换 void 指针到结构引用
我想将 void 指针转换为结构引用。结构的最小示例: #include "Interface.h" class Foo { public: Foo() : mAddress((uint
javascript - 为什么一个元素从窗口的左上角开始它的 css3 转换/转换？
这有点烦人:我有一个 div，它从窗口的左上角开始过渡，即使它位于文档的其他任何位置。我试过 usign -webkit-transform-origin 但没有成功，也许我用错了。有人可以帮助我吗？
html - 有什么方法可以检测 CSS3 转换/转换/动画的过程状态？
假设，如果将 CSS3 转换/转换/动画分配给 DOM 元素，我是否可以检测到该过程的状态？我想这样做的原因是因为我正在寻找类似过渡链的东西，例如，在前一个过渡之后运行一个过渡。最佳答案我在 h
CSS 转换/转换 - 谷歌浏览器中的 "shaky"图像
最近我遇到了“不稳定”屏幕，这很可能是由 CSS 转换引起的。事实上，它只发生在 Chrome 浏览器上(可能还有 Safari，因为一些人也报告了它)。知道如何让它看起来光滑吗？此外，您可能会注意
jquery - CSS3 转换(转换)在 Firefox 中不起作用，但在 Chrome 和 Safari 中起作用
我正在开发一个简单的 slider ，它使用 CSS 过渡来为幻灯片设置动画。我用一些基本样式和一些 javascript 创建了一支笔 here .注意:由于 Codepen 使用 Prefixfr
Linq 转换
我正在使用以下代码返回 IList: public IList FindCodesByCountry(string country) { var query =
转换、计算的RESTful设计
如何设计像这样的操作: 计算转化翻译例如:从“EUR”转换为“CNY”金额“100”。这是 /convert?from=EUR&to=CNY&amount=100 RESTful 吗？最佳答
Jquery 转换
我使用 jquery 组合了一个图像滚动器，如下所示 function rotateImages(whichHolder, start) { var images = $('#' +which
CSS 转换
如何使用 CSS (-moz-transform) 更改一个如下所示的 div: 最佳答案你可以看看Mozilla Developer Center .甚至还有例子。但是，在我看来，您的具体示例不
CSS 转换
我需要帮助我正在尝试在选中和未选中的汉堡菜单上实现动画。我能够为菜单设置动画，但我不知道如何在转换为 0 时为左菜单动画设置动画 &__menu { transform: translateX(
swift :转换
我正在为字典格式之间的转换而苦苦挣扎:我正在尝试将下面的项目数组转换为下面的结果数组。本质上是通过在项目第一个元素中查找重复项，然后仅在第一个参数不同时才将文件添加到结果集中。 var items:[
具有相同布局的不同类型之间的C++转换
如果我有两个定义相同的结构，那么在它们之间进行转换的最佳方式是什么？ struct A { int i; float f; }; struct B { int i; float f; }; void
Javascript 转换
我编写了一个 javascript 代码，可以将视口(viewport)从一个链接滑动到另一个链接。基本上一切正常，你怎么能在那里看到http://jsfiddle.net/DruwJ/8/ 我现在的
meteorjs 图像上传/转换
我需要将文件上传到 meteor ，对其进行一些图像处理(必要时进行图像转换，从图像生成缩略图)，然后将其存储在外部图像存储服务器(s3)中。这应该尽可能快。您对 nodejs 图像处理库有什么建议
KDB+，转换，左操作数
刚开始接触KDB+，有一些问题很难从Q for Mortals中得到。说，这里 http://code.kx.com/wiki/JB:QforMortals2/casting_and_enumera
JSF float 转换
我在这里的一个项目中使用 JSF 1.2 和 IceFaces 1.8。我有一个页面，它基本上是一大堆浮点数字段的大编辑网格。这是通过 inputText 实现的页面上的字段指向具有原始值的值对象
SceneKit 转换 ScnMatrix4
ScnMatrix4 是一个 4x4 矩阵。我的问题是什么矩阵行对应于位置(ScnVector3)，旋转(ScnVector4)，比例(ScnVector3)。第 4 行是空的吗？编辑: 我玩弄了
Scala map 转换
恐怕我是 Scala 新手: 我正在尝试根据一些简单的逻辑将 Map 转换为新 Map: val postVals = Map("test" -> "testing1", "test2" -> "te
基于配置文件的 XSLT 转换
输入: This is sample 1 This is sample 2 输出: ~COLOR~[Green]This is sample 1~COLOR~[Red]This is sam

首页

博学

6Ren·AI

商城

c++ - 避免/设置 std::cout/std::cerr 的字符集转换/编码