gpt4 book ai didi

C++ 32 位与 64 位 float 限制

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:04:21 24 4
gpt4 key购买 nike

鉴于代码段如下,我只想知道

  • 为什么long double的最大值在64位比32位小?
  • 为什么 64 位版本不能像 32 位版本那样扩展数字来填充“40”精度输出?
  • LDBL_MIN 和 LDBL_MAX 的值似乎相等,这是一个错误吗?

我查看了我机器中的 float.h 文件,但找不到这些宏常量的明确定义。

测试代码(平台 = Win7-64bit)

#include <cfloat>
#include <iomanip>
cout<<"FLT_MAX ="<< setprecision(40) << FLT_MAX << endl;
cout<<"DBL_MAX ="<< setprecision(40) << DBL_MAX << endl;
cout<<"LDBL_MAX ="<< setprecision(40) << LDBL_MAX << endl;
cout<<"FLT_MIN ="<< setprecision(40) << FLT_MIN << endl;
cout<<"DBL_MIN ="<< setprecision(40) << DBL_MIN << endl;
cout<<"LDBL_MIN ="<< setprecision(40) << LDBL_MIN << endl;

32 位结果 (MinGW-20120426)

FLT_MAX  =340282346638528859811704183484516925440
DBL_MAX =1.797693134862315708145274237317043567981e+308
LDBL_MAX =1.189731495357231765021263853030970205169e+4932
FLT_MIN =1.175494350822287507968736537222245677819e-038
DBL_MIN =2.225073858507201383090232717332404064219e-308
LDBL_MIN =3.362103143112093506262677817321752602598e-4932

64 位结果(MinGW64-TDM 4.6)

FLT_MAX  =340282346638528860000000000000000000000
DBL_MAX =1.7976931348623157e+308
LDBL_MAX =1.132619801677474e-317
FLT_MIN =1.1754943508222875e-038
DBL_MIN =2.2250738585072014e-308
LDBL_MIN =1.132619801677474e-317

谢谢。

[编辑]:使用最新的 MinGW64-TGM 4.7.1,LDBL_MAX、LDBL_MIN 的“错误”似乎已被删除。

最佳答案

LDBL_MAX =1.132619801677474e-317听起来像是某个地方的错误。标准要求每个值都表示为 double也可以表示为 long double , 所以对于 LDBL_MAX < DBL_MAX 是不允许的.鉴于您没有显示您的真实测试代码,我个人会在责备编译器之前检查一下。

如果 long double 确实存在(非错误)差异在两者之间,那么这种差异的基础是您的 32 位编译器使用较旧的 x87 浮点运算,它具有 80 位精度,因此允许 80 位 long double .

您的 64 位编译器使用 x64 中较新的 64 位浮点运算。没有 80 位精度,也不需要切换到 x87 指令来实现更大的 long double .

它可能比这更复杂。例如,并非所有 x86 编译器都必须具有 80 位 long double .他们如何做出决定取决于各种因素,可能包括 SSE2 具有 64 位浮点运算这一事实。但可能性是 long doubledouble 大小相同,或者它更大。

why 64-bit version cannot expand as much digits as in 32-bit version to fill the "40" precision output?

double 只有大约 15 位十进制数字。超出此范围的数字有时会提供信息,但通常会产生误导。

我不记得标准对 setprecision 说了什么,但假设允许实现在停止生成数字的地方画一条线,double 的精度是绘制它的合理位置。至于为什么一个实现决定实际执行此操作而另一个实现却没有——我不知道。由于它们是不同的发行版,它们可能使用完全不同的标准库。

同样的“伪精度”是您看到 340282346638528859811704183484516925440 的原因在一种情况下为 FLT_MAX,但 340282346638528860000000000000000000000在另一个。一个编译器(或者更确切地说,一个库实现)已经解决了计算大量数字的问题。另一个早早放弃了。

关于C++ 32 位与 64 位 float 限制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12706368/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com