c++ - iostreams - 打印 `wchar_t` 或 `charXX

c++ - iostreams - 打印 `wchar_t` 或 `charXX_t` 值作为字符

转载作者：塔克拉玛干更新时间：2023-11-02 23:42:50

27

4

如果你输入 wchar_t , char16_t , 或 char32_t value 到一个窄的 ostream，它将打印代码点的数值。

#include <iostream>
using std::cout;
int main()
{
    cout << 'x' << L'x' << u'x' << U'x' << '\n';
}

打印 x120120120 .这是因为有一个 operator<<对于basic_ostream的具体组合及其 charT , 但其他字符类型没有类似的运算符，因此它们会自动转换为 int并以这种方式打印。同样，非窄字符串文字( L"x" 、 u"x" 、 U"X" )将被静默转换为 void*并打印为指针值，非窄字符串对象(wstring、u16string、u32string)甚至无法编译。

所以，问题是:打印 wchar_t 的最不糟糕的方法是什么？ , char16_t , 或 char32_t窄 ostream 上的值，作为字符，而不是代码点的数值？它应该正确地将 ostream 编码中可表示的所有代码点转换为该编码，并且当代码点不可表示时应报告错误。 (例如，给定 u'…' 和一个 UTF-8 ostream，三字节序列 0xE2 0x80 0xA6 应该写入流；但是给定 u'â' 和一个 KOI8-R ostream，应该报告错误。)

同样，如何在窄 ostream 上打印非窄 C 字符串或字符串对象，并转换为输出编码？

如果这不能在 ISO C++11 中完成，我将采用特定于平台的答案。

(灵感来自 this question 。)

最佳答案

如您所述，没有 operator<<(std::ostream&, const wchar_t)对于狭窄的 ostream。如果你想使用语法，你可以教 ostream如何处理 wchar s 以便该例程被选为比需要首先转换为整数的例程更好的重载。

如果你喜欢冒险:

namespace std {
  ostream& operator<< (ostream& os, wchar_t wc) {
    if(unsigned(wc) < 256) // or another upper bound
      return os << (unsigned char)wc;
    else
      throw your_favourite_exception; // or handle the error in some other way
  }
}

否则，做一个简单的struct透明地包含 wchar_t并且有一个自定义 friend operator<<并在输出之前将宽字符转换为宽字符。

编辑:要与语言环境进行即时转换，您可以使用 <cwchar> 中的函数，比如:

ostream& operator<< (ostream& os, wchar_t wc) {
    std::mbstate_t state{};
    std::string mb(MB_CUR_MAX, '\0');
    size_t ret = std::wcrtomb(&mb[0], wc, &state);
    if(ret == static_cast<std::size_t>(-1))
        deal_with_the_error();
    return os << mb;
}

不要忘记将您的语言环境设置为系统默认值:

std::locale::global(std::locale(""));
std::cout << L'ŭ';

关于c++ - iostreams - 打印 `wchar_t` 或 `charXX_t` 值作为字符，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41107667/

27

4

0

文章推荐： java - 通过 JNA 使用 Xlib 移动窗口

文章推荐： android - ClusterManager.clearItems() 不清除项目

文章推荐： linux - 使用 echo 命令格式化

c++ - 无法从 'TCHAR [260]' 转换为 'std::basic_string,std::allocator>
error C2440: 'initializing': cannot convert from 'TCHAR [260]' to 'std::basic_string,std::allocator>
c++ - 不存在合适的构造函数来从 "const char [8]"转换为 "std::basic_string, std::allocator>"
首先。我想说，我不是 C++ 程序员。outlook 字符串在 visual studio 2015 中生成错误，并显示标题中的消息。 HWND windowHandle = (HWND)FindPr
C++ wchar_t * 等于对其他 wchar_t * 不区分大小写
我正在尝试检查一个 wchar_t * 是否等于另一个 wchar_t * 不区分大小写。有人可以把我放在正确的位置吗？这是我尝试过的: wchar_t *vectored[80] = { ...
c++ - 如何访问 wchar_t* 的 wchar_t？
这是我的代码: wchar_t wbuffer[512]; wchar_t* wc = (wchar_t*) malloc(buffer_size); int buflen = 0;
c++ - 无法将参数 1 从 'ATL::CStringT>>' 转换为 'const char *'
如何正确转换这种方式？ VARIANT varIndex; CString csIndex; //Index BSTR csIndex = (LPCSTR)(_bstr
c++ - codecvt_utf8 被转换为原生 codecvt
我将以下代码作为我正在编写的字符串类中的私有(private)函数(它是从 wstring_convert “借来的”，并由我进行了一些修改): template std::string my_st
c++ - 将具有 wchar_t 数字值的 vector 转换为 wchar_t
我有这样的东西: vector elements; 其中包含: 083938F8 083938FA 083938FC 083938FE 08393900 08393902 08393904 我想将它们
c - 为什么没有“unsigned wchar_t”和“signed wchar_t”类型？
字符的签名不规范。因此，有signed char和unsigned char类型。因此，使用单个字符的函数必须使用既可以包含有符号字符又可以包含无符号字符的参数类型（此类型选择为int），因为如果参
c++ - 从表达式 `wchar_t + wchar_t[]` 到 std::wstring 的隐式转换中的垃圾值
我在 Visual Studio C++ 2013 Community Edition 中遇到了一些奇怪的事情，这可能是编译器错误，也可能是我正在编写在没有警告的情况下进行编译的无效代码。考虑以下片
c++ - operator wchar_t**() 未能提供到 const wchar_t ** 的隐式转换 - 为什么？
我无法理解为什么某个隐式转换没有按我预期的那样工作。我有以下类(class) ref class ManagedWStringArrayWrapper { wchar_t** m_pointe
c - 无法将 wchar_t 的内容复制到另一个已 malloc 的 wchar_t var 中？
我有一个名为 DirToEmpty 的变量，它保存临时目录的路径。我有另一个名为 TempBufDir 的变量，它将保持与 DirToEmpty 相同的值，但反斜杠被转义。预期行为示例: wcha
visual-studio-2010 - 如何将 const wchar_t* 转换为 wchar_t 或多字节 char？
我需要在附加 '\n' 后将多字节字符发送到套接字，但我拥有的是一个 const wchar_t*。我如何转换它？最佳答案如果您的问题是如何实际操作常量的内容，请考虑 const_cast . 关
c++ - ‘virtual char std::ctype::do_narrow(wchar_t, char) const’ protected
我正在尝试使用语言环境方面将 wstring 转换为字符串，但我遇到了以下错误: test_facet.cpp: In function ‘int main()’: test_facet.cpp:14
c++ - 如何修复 "State Error (active) E0513 a value of type “const wchar_t *” 无法分配给类型为 “wchar_t *” 的实体“
我正在尝试使用 C++ 更改文件的属性我究竟做错了什么？代码完全拿下 https://learn.microsoft.com/en-us/windows/win32/stg/writeread-sa
c++ - wchar_t 字符串数组的成员丢失
我尝试将以下字符串数组传递给函数: const wchar_t *testTokens[] = { L"function", L"(",
c - wchar_t 读取
已关闭。此问题需要 debugging details 。目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and the
c - 将阿拉伯字符声明并打印为 wchar_t
我尝试将阿拉伯字符存储为 wchar_t，然后将其打印到控制台，但无法使其工作。我已将控制台设置为 UTF-8，如果我只是将阿拉伯字母输入控制台，它们就会正确显示(尽管未加入)。我根据( How
C 存储并打印 wchar_t
我想存储一个包含扩展 ascii 表中字符的字符串，并打印它们。我尝试过: wchar_t wp[] = L"Росси́йская Акаде́мия Нау́к "; printf("%S", w
c++ - 在主函数中使用 wchar_t
在C++ Visual Studio 2017中使用main函数是否错误如下: int main(int argc, wchar_t* argv[]) 因为我的程序可以接收特殊字符。最佳答案请阅读
c++ - 无法创建新的 wchar_t *
我有这个运算符重载器。我的程序在创建新的 wchar_t 数组时崩溃。 myObject &operator += (const myObject &s) { wchar_t *cat = w

首页

博学

6Ren·AI

商城

c++ - iostreams - 打印 `wchar_t` 或 `charXX_t` 值作为字符