gpt4 book ai didi

c++ - 为什么 wstring_convert 抛出 range_error?

转载 作者:搜寻专家 更新时间:2023-10-31 02:22:12 25 4
gpt4 key购买 nike

我正在编写一些需要使用系统语言环境在字节字符串和宽字符串之间进行转换的代码。从文件中读取时,这非常容易做到。我可以使用 std::wifstream , 用 std::locale("") 灌输它, 然后只使用 std::getline .

根据 cppreference 的 codecvt页,wifstream只使用 codecvt<wchar_t, char, mbstate_t> ,所以我认为我可以在 std::string 之间进行转换和 std::wstring也可以使用它:

// utility wrapper to adapt locale-bound facets for wstring/wbuffer
convert
template<class Facet>
struct deletable_facet : Facet
{
template<class ...Args>
deletable_facet(Args&& ...args) : Facet(std::forward<Args>(args)...) {}
~deletable_facet() {}
};

std::locale::global(std::locale(""));
std::wstring_convert<
deletable_facet<std::codecvt<wchar_t, char, std::mbstate_t>>> wconv;
std::wstring wstr = wconv.from_bytes(data);

但是,当我尝试运行它时,我得到一个 range_errorwstring_convert 抛出.我做了一些谷歌搜索,显然这就是 wstring_convert 时发生的情况。无法转换字符串。

但是,这些字符串显然可以使用 wfstream 完全转换。 ,应该使用相同的 codecvt因为我正在使用 wstring_convert .那么为什么 wifstream工作,但是wstring_convert不是吗?

有没有一种方法可以在 string 之间进行转换? s 和 wstring正在使用系统的语言环境吗?

我的问题的完整示例,改编自 codecvt页,是 here ,输出为:

sizeof(char32_t) = 4
sizeof(wchar_t) = 4
The UTF-8 file contains the following UCS4 code points:
U+007a
U+00df
U+6c34
U+1f34c
The UTF-8 string contains the following UCS4 code points:
U+007a
U+00df
U+6c34
U+1f34c
terminate called after throwing an instance of 'std::range_error'
what(): wstring_convert
Aborted (core dumped)

最佳答案

您的wifstreamwstring_convert 使用不同的方面。

wifstream 正在使用依赖于语言环境的转换方面;它通过 std::use_facet

将它从 std::locale("") 中提取出来

wstring_convert 被赋予了一个与语言环境无关的独立 codecvt facet,而您的实现提供的 codecvt facet 显然不会将 UTF-8 转换为任何合适的东西;尝试调用 in直接在上面查看它的作用。

获取依赖于语言环境的方面的一种简单方法是按名称请求它,如 std::codecvt_byname

关于c++ - 为什么 wstring_convert 抛出 range_error?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30554209/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com