- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我编写了一个将 wstring 转换为字符串的函数。如果我删除代码 setlocale(LC_CTYPE, ""),程序就会出错。我引用了 cplusplus阅读文档。
C string containing the name of a C locale. These are system specific, but at least the two following locales must exist:
"C" Minimal "C" locale
"" Environment's default localeIf the value of this parameter is NULL, the function does not make any changes to the current locale, but the name of the current locale is still returned by the function.
我的代码在这里,源代码来自cplusplus.com(我添加了一些汉字):
/* wcstombs example */
#include <stdio.h> /* printf */
#include <stdlib.h> /* wcstombs, wchar_t(C) */
#include <locale.h> /* setlocale */
int main()
{
setlocale(LC_CTYPE, "");
const wchar_t str[] = L"中国、wcstombs example";
char buffer[64];
int ret;
printf ("wchar_t string: %ls \n",str);
ret = wcstombs ( buffer, str, sizeof(buffer) );
if (ret==64)
buffer[63]='\0';
if (ret)
printf ("length:%d,multibyte string: %s \n",ret,buffer);
return 0;
}
如果我删除代码 setlocale(LC_CTYPE, ""),程序不会按预期运行。我的问题是:“如果我在不同的机器上运行,程序会有所不同?正如文档所说,如果区域设置为“”,函数不会对当前区域设置进行任何更改,但仍会返回当前区域设置的名称由函数。”因为不同机器的当前语言环境可能不同?
这里是我的c++版本的wstring转wstring,string转wstring不需要函数setlocale,程序运行良好:
/*
string converts to wstring
*/
std::wstring s2ws(const std::string& src)
{
std::wstring res = L"";
size_t const wcs_len = mbstowcs(NULL, src.c_str(), 0);
std::vector<wchar_t> buffer(wcs_len + 1);
mbstowcs(&buffer[0], src.c_str(), src.size());
res.assign(buffer.begin(), buffer.end() - 1);
return res;
}
/*
wstring converts to string
*/
std::string ws2s(const std::wstring & src)
{
setlocale(LC_CTYPE, "");
std::string res = "";
size_t const mbs_len = wcstombs(NULL, src.c_str(), 0);
std::vector<char> buffer(mbs_len + 1);
wcstombs(&buffer[0], src.c_str(), buffer.size());
res.assign(buffer.begin(), buffer.end() - 1);
return res;
}
最佳答案
如果 setlocale 的第二个参数为 NULL,它除了返回当前区域设置外什么都不做。但你没有那样做。您向它发送一个完全由单个零字节组成的字符串,又名 ""
。我的 setlocale 手册页说
If locale is an empty string, "", each part of the locale that should be modified is set according to the environment variables. The details are implementation-dependent.
因此,这为您所做的是将语言环境设置为用户指定的任何内容或系统默认值。
根本不运行 setlocale 可能会使当前语言环境在您的系统上未初始化或为 NULL,这就是为什么您的程序在没有该设置的情况下失败的原因。
你正在使用的东西的另外两个手册页说
The behavior of mbstowcs() depends on the LC_CTYPE category of the current locale.
The behavior of wcstombs() depends on the LC_CTYPE category of the current locale.
如果您根本没有设置语言环境,大概这些例程是失败的。
我猜你可能不需要在每次调用这些例程时都运行 setlocale 语句,但你需要确保它在运行它们之前至少运行一次。
至于根据当前语言环境发生的不同情况,我相信这就是多字节字符串如何准确地转换为宽字符,反之亦然。我认为由于这种差异,这些例程的手册页使其含糊不清。就个人而言,我更喜欢它设置一些示例,例如,“如果当前语言环境是C
,则多字节字符串是ASCII 字符。”我想至少还有一个被解释为 UTF-8,但我对不同的语言环境了解不多,无法准确地说出是哪一个。可能至少还有一种语言环境,其中多字节字符串恰好是每个字符编码的另外两个字节,但 C 和 C++ 仍会将其视为字节。
编辑:再考虑一下,鉴于您添加到示例代码中的字符,明确声明使用不支持中文字符的语言环境将导致最终 printf 报告长度为 -1 可能是有意义的,这包括默认的 C 语言环境。在这种情况下,标准并没有明确指定缓冲区的内容——至少,我对它的阅读表明缓冲区值可能是所有字符,但不包括转换失败的字符。虽然 C++ 文档和 C 文档都没有说明关于无法转换的字符会发生什么。我没有为官方标准付费,但我有最新免费版本的拷贝。 C++17 遵循 C17。 C17 也避免对此功能的这一方面发表评论。对于 wcsrtombs,它明确声明转换状态未指定。然而,在 wcstombs_s 上,C17 状态
If the conversion stops without converting a null wide character and dst is not a null pointer, then a null character is stored into the array pointed to by dst immediately following any multibyte characters already stored.
在我自己对上述 OP 提供的代码进行的实验中,Fedora 28 上的 wcstombs 实现似乎只是避免对缓冲区进行任何进一步的更改。这似乎向我表明,如果代码的确切行为对这种情况很重要,那么使用 wcstombs_s 可能更有意义。但至少,您只需检查返回的长度是否为 -1,如果是,则报告错误而不是假设转换成功。
关于c++ - setlocale 函数有什么作用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54319520/
C语言sscanf()函数:从字符串中读取指定格式的数据 头文件: ?
最近,我有一个关于工作预评估的问题,即使查询了每个功能的工作原理,我也不知道如何解决。这是一个伪代码。 下面是一个名为foo()的函数,该函数将被传递一个值并返回一个值。如果将以下值传递给foo函数,
CStr 函数 返回表达式,该表达式已被转换为 String 子类型的 Variant。 CStr(expression) expression 参数是任意有效的表达式。 说明 通常,可以
CSng 函数 返回表达式,该表达式已被转换为 Single 子类型的 Variant。 CSng(expression) expression 参数是任意有效的表达式。 说明 通常,可
CreateObject 函数 创建并返回对 Automation 对象的引用。 CreateObject(servername.typename [, location]) 参数 serv
Cos 函数 返回某个角的余弦值。 Cos(number) number 参数可以是任何将某个角表示为弧度的有效数值表达式。 说明 Cos 函数取某个角并返回直角三角形两边的比值。此比值是
CLng 函数 返回表达式,此表达式已被转换为 Long 子类型的 Variant。 CLng(expression) expression 参数是任意有效的表达式。 说明 通常,您可以使
CInt 函数 返回表达式,此表达式已被转换为 Integer 子类型的 Variant。 CInt(expression) expression 参数是任意有效的表达式。 说明 通常,可
Chr 函数 返回与指定的 ANSI 字符代码相对应的字符。 Chr(charcode) charcode 参数是可以标识字符的数字。 说明 从 0 到 31 的数字表示标准的不可打印的
CDbl 函数 返回表达式,此表达式已被转换为 Double 子类型的 Variant。 CDbl(expression) expression 参数是任意有效的表达式。 说明 通常,您可
CDate 函数 返回表达式,此表达式已被转换为 Date 子类型的 Variant。 CDate(date) date 参数是任意有效的日期表达式。 说明 IsDate 函数用于判断 d
CCur 函数 返回表达式,此表达式已被转换为 Currency 子类型的 Variant。 CCur(expression) expression 参数是任意有效的表达式。 说明 通常,
CByte 函数 返回表达式,此表达式已被转换为 Byte 子类型的 Variant。 CByte(expression) expression 参数是任意有效的表达式。 说明 通常,可以
CBool 函数 返回表达式,此表达式已转换为 Boolean 子类型的 Variant。 CBool(expression) expression 是任意有效的表达式。 说明 如果 ex
Atn 函数 返回数值的反正切值。 Atn(number) number 参数可以是任意有效的数值表达式。 说明 Atn 函数计算直角三角形两个边的比值 (number) 并返回对应角的弧
Asc 函数 返回与字符串的第一个字母对应的 ANSI 字符代码。 Asc(string) string 参数是任意有效的字符串表达式。如果 string 参数未包含字符,则将发生运行时错误。
Array 函数 返回包含数组的 Variant。 Array(arglist) arglist 参数是赋给包含在 Variant 中的数组元素的值的列表(用逗号分隔)。如果没有指定此参数,则
Abs 函数 返回数字的绝对值。 Abs(number) number 参数可以是任意有效的数值表达式。如果 number 包含 Null,则返回 Null;如果是未初始化变量,则返回 0。
FormatPercent 函数 返回表达式,此表达式已被格式化为尾随有 % 符号的百分比(乘以 100 )。 FormatPercent(expression[,NumDigitsAfterD
FormatNumber 函数 返回表达式,此表达式已被格式化为数值。 FormatNumber( expression [,NumDigitsAfterDecimal [,Inc
我是一名优秀的程序员,十分优秀!