gpt4 book ai didi

c - scanf() 和 strtol()/strtod() 解析数字的区别

转载 作者:太空狗 更新时间:2023-10-29 16:41:13 24 4
gpt4 key购买 nike

注意:我完全重新设计了问题以更恰本地反射(reflect)我设置赏金的目的。请原谅这可能造成的与已经给出的答案不一致的地方。我不想创建一个新问题,因为之前对此问题的回答可能会有帮助。


我正在致力于实现一个 C 标准库,并且对该标准的一个特定角落感到困惑。

该标准定义了 scanf 接受的数字格式根据 strtol 的定义,函数族(%d、%i、%u、%o、%x) , strtoul , 和 strtod .

标准还说 fscanf()只会将最多一个字符放回到输入流中,因此一些序列被 strtol 接受, strtoulstrtod Not Acceptable fscanf (ISO/IEC 9899:1999,脚注 251)。

我试图找到一些会表现出这种差异的值。事实证明,十六进制前缀“0x”后跟一个非十六进制数字的字符是两个函数系列不同的一种情况。

有趣的是,很明显没有两个可用的 C 库似乎在输出上一致。 (请参阅此问题末尾的测试程序和示例输出。)

我想听到的是在解析“0xz”时什么会被视为符合标准的行为?。最好引用标准中的相关部分来说明这一点。

#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

int main()
{
int i, count, rc;
unsigned u;
char * endptr = NULL;
char culprit[] = "0xz";

/* File I/O to assert fscanf == sscanf */
FILE * fh = fopen( "testfile", "w+" );
fprintf( fh, "%s", culprit );
rewind( fh );

/* fscanf base 16 */
u = -1; count = -1;
rc = fscanf( fh, "%x%n", &u, &count );
printf( "fscanf: Returned %d, result %2d, consumed %d\n", rc, u, count );
rewind( fh );

/* strtoul base 16 */
u = strtoul( culprit, &endptr, 16 );
printf( "strtoul: result %2d, consumed %d\n", u, endptr - culprit );

puts( "" );

/* fscanf base 0 */
i = -1; count = -1;
rc = fscanf( fh, "%i%n", &i, &count );
printf( "fscanf: Returned %d, result %2d, consumed %d\n", rc, i, count );
rewind( fh );

/* strtol base 0 */
i = strtol( culprit, &endptr, 0 );
printf( "strtoul: result %2d, consumed %d\n", i, endptr - culprit );

fclose( fh );
return 0;
}

/* newlib 1.14

fscanf: Returned 1, result 0, consumed 1
strtoul: result 0, consumed 0

fscanf: Returned 1, result 0, consumed 1
strtoul: result 0, consumed 0
*/

/* glibc-2.8

fscanf: Returned 1, result 0, consumed 2
strtoul: result 0, consumed 1

fscanf: Returned 1, result 0, consumed 2
strtoul: result 0, consumed 1
*/

/* Microsoft MSVC

fscanf: Returned 0, result -1, consumed -1
strtoul: result 0, consumed 0

fscanf: Returned 0, result 0, consumed -1
strtoul: result 0, consumed 0
*/

/* IBM AIX

fscanf: Returned 0, result -1, consumed -1
strtoul: result 0, consumed 1

fscanf: Returned 0, result 0, consumed -1
strtoul: result 0, consumed 1
*/

最佳答案

与 PL22.11 (ANSI "C") 的副主席 Fred J. Tydeman 就 comp.std.c 进行的交流阐明了这一点:

fscanf

An input item is defined as the longest sequence of input characters [...] which is, or is a prefix of, a matching input sequence. (7.19.6.2 P9)

这使得“0x”成为匹配输入序列前缀的最长序列。 (即使使用 %i 转换,因为十六进制“0x”的序列比十进制“0”更长。)

The first character, if any, after the input item remains unread. (7.19.6.2 P9)

这使得 fscanf 读取“z”,并将其放回原处(遵守脚注 251 的单字符回退限制)。

If the input item is not a matching sequence, the execution of the directive fails: this condition is a matching failure. (7.19.6.2 P10)

这使得“0x”无法匹配,即 fscanf 不应该赋值,返回零(如果 %x%i是第一个转换说明符),并将“z”保留为输入流中的第一个未读字符。

strtol

strtol(和strtoul)的定义有一个关键点不同:

The subject sequence is defined as the longest initial subsequence of the input string, starting with the first non-white-space character, that is of the expected form. (7.20.1.4 P4, emphasis mine)

这意味着 strtol 应该寻找最长的 valid 序列,在本例中为“0”。它应该将 endptr 指向“x”,并返回零作为结果。

关于c - scanf() 和 strtol()/strtod() 解析数字的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1425730/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com