gpt4 book ai didi

c - 使用 strtod strtof atof printf 进行语言环境不变的字符串处理?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:07:53 24 4
gpt4 key购买 nike

是否有任何计划添加在当前语言环境下不变的 C 标准库字符串处理函数版本?

目前有很多脆弱的解决方法,例如,来自 jansson/strconv.c:

static void to_locale(strbuffer_t *strbuffer)
{
const char *point;
char *pos;

point = localeconv()->decimal_point;
if(*point == '.') {
/* No conversion needed */
return;
}

pos = strchr(strbuffer->value, '.');
if(pos)
*pos = *point;
}

static void from_locale(char *buffer)
{
const char *point;
char *pos;

point = localeconv()->decimal_point;
if(*point == '.') {
/* No conversion needed */
return;
}

pos = strchr(buffer, *point);
if(pos)
*pos = '.';
}

这些函数对其输入进行预处理,因此可以在假设下独立于当前语言环境使用

  1. 分隔符是一个字节
  2. 在这些修复函数和调用任何受影响的函数之间没有调用 setlocale
  3. 字符串可以在转换前修改

(1) 暗示预处理方法在异国情调的地方中断(参见 https://en.wikipedia.org/wiki/Decimal_mark#Hindu.E2.80.93Arabic_numeral_system 的例子)。(2) 暗示预处理方法在没有锁的情况下不能是线程安全的,并且必须将锁添加到 C 库中。 (3) 只是愚蠢。

如果只能为字符串处理函数的单个调用指定语言环境作为参数,而不影响任何其他线程,则这些限制都不适用。

问题:

  1. WG14 或 WG21 是否有解决此缺陷的报告?
  2. 如果是这样,为什么没有将它们合并到标准中?它只不过是一组以语言环境为参数的新函数。
  3. 规范的解决方法是什么?

更新:

通过互联网搜索后,我找到了 *_l 函数,可在 FreeBSD、GNU/Linux 和 MacOSX 上使用。 Windows 上也存在类似的功能。这些解决了我的问题,但是这些不在 POSIX 中,它是 C 的超集(不是真的,POSIX 放宽了指针)。所以问题 1 和 2 仍然悬而未决。

最佳答案

BSD 和 macOS Sierra(以及之前的 Mac OS X)支持 _l允许您指定区域设置的函数,而不是依赖于当前区域设置。例如:

int
fprintf_l(FILE * restrict stream, locale_t loc, const char * restrict format, ...);

int
printf_l(locale_t loc, const char * restrict format, ...);

int
snprintf_l(char * restrict str, size_t size, locale_t loc, const char * restrict format, ...);

int
sprintf_l(char * restrict str, locale_t loc, const char * restrict format, ...);

和:

int
fscanf_l(FILE * restrict stream, locale_t loc, const char * restrict format, ...);

int
scanf_l(locale_t loc, const char * restrict format, ...);

int
sscanf_l(const char * restrict str, locale_t loc, const char * restrict format, ...);

作为一般设计,这似乎是明智的。类型locale_t不是标准 C 的一部分,而是 POSIX 的一部分(并在 <locale.h> 中定义),并在 <ctype.h> 中使用在其他地方。 BSD 手册页说要使用的 header 是 <xlocale.h>而不是 <locale.h> ;这可能会由标准修复。除非 BSD 函数的设计存在重大缺陷,否则这些应该是任何标准化工作的良好基础,无论是在 POSIX 还是标准 C 下。

BSD 设计的一个问题可能是 locale_t结构是按值传递的,而不是按(常量限制)指针传递的,这有点令人惊讶。但是,它与 POSIX 函数一致,例如:

int   isalpha_l(int, locale_t);

也可以设计一个类似的方案来处理时区设置。由于还没有时区类型(而 locale_t 已经是 POSIX 的一部分,并且可能无需更改为标准 C 即可采用),因此在设置时需要做更多的工作。但是,结合语言环境设置,它可以使时间例程更容易从单个可执行文件用于不同的环境。

关于c - 使用 strtod strtof atof printf 进行语言环境不变的字符串处理?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41794607/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com