gpt4 book ai didi

c++ - 如何在 C++ 中大写/小写 UTF-8 字符?

转载 作者:可可西里 更新时间:2023-11-01 16:06:32 28 4
gpt4 key购买 nike

假设我有一个 UTF-8 编码的 std::string 包含以下内容:

óó

我想将其转换为以下内容:

ÓÓ

理想情况下,我希望我使用的大写/小写方法在所有 UTF-8 中通用。如果可能的话。

字符串中的原始字节序列是 0xc3b3c3b3(每个字符两个字节,ó 的两个实例),我希望输出为 0xc393c393(Ó 的两个实例)。有some examples在 StackOverflow 上,但他们使用宽字符串,并且 other answers说你不应该为 UTF-8 使用宽字符串。看起来这个问题可能非常“棘手”,因为输出可能取决于用户的区域设置。

我原以为只使用 std::toupper() 之类的东西,但我真的不清楚它的用法,因为看起来我不只是一次转换一个字符,而是转换一个字符整个字符串。另外,这个 Ideone example我放在一起似乎表明 0xc3b3toupper() 只是 0xc3b3,这是一个意想不到的结果。将 setlocale 调用为 UTF-8 或 ISO8859-1 似乎不会改变结果。

如果您能阐明我做错了什么或为什么我的问题/前提有问题,我希望得到一些指导!

最佳答案

在 C++ 中没有进行 Unicode 大小写转换的标准方法。有一些方法适用于一些 C++ 实现,但标准并不要求它们这样做。

如果您想要保证 Unicode 大小写转换,您将需要使用类似 ICU 的库或 Boost.Locale(又名:具有更类似于 C++ 的界面的 ICU)。

关于c++ - 如何在 C++ 中大写/小写 UTF-8 字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36897781/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com