gpt4 book ai didi

c++ - 使用 mbsnrtowcs 进行多字节到 Widechar 的转换

转载 作者:行者123 更新时间:2023-11-28 07:53:21 25 4
gpt4 key购买 nike

我正在尝试将多字节 (UTF) 字符串转换为 Widechar 字符串,但 mbsnrtowcs 总是失败。这是输入和预期的字符串:

char* pInputMultiByteString = "A quick brown Fox jumps \xC2\xA9 over the lazy Dog.";
wchar_t* pExpectedWideString = L"A quick brown Fox jumps \x00A9 over the lazy Dog.";

特殊字符是版权符号。

当我使用 Windows MultiByteToWideChar 例程时,此转换工作正常,但由于该 API 在 linux 上不可用,我必须使用 mbsnrtowcs - 这是失败的。我也尝试过使用其他角色,但总是失败。唯一的期望是,当我仅使用基于 ASCII 的输入字符串时,mbsnrtowcs 可以正常工作。我做错了什么?

最佳答案

UTF 不是多字节字符串(尽管 unicode 字符确实会使用超过 1 个字节来表示)。多字节字符串是使用一定的代码页来表示字符的字符串,其中一些字符会使用多个字节。

由于您要组合 ANSI 字符和 UTF 字符,因此您应该使用 UTF8。

因此,尝试使用 mbsnrtowcs 将 UTF 转换为 wchar_t(在 Windows 上是 UTF16,在 linux 上是 UTF32)是无法完成的。

如果您使用 UTF8,您应该查看 UNICODE 处理库。对于大多数任务,我建议使用 http://utfcpp.sourceforge.net/ 中的 UTF8-CPP

您可以在维基百科上阅读有关 UNICODE 和 UTF8 的更多信息。

关于c++ - 使用 mbsnrtowcs 进行多字节到 Widechar 的转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13261468/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com