c++ - 单精度 float 的第 24 个小数位在哪里？ IEEE 754-6ren

c++ - 单精度 float 的第 24 个小数位在哪里？ IEEE 754

转载作者：可可西里更新时间：2023-11-01 18:04:54

25

4

今天我发现自己在做一些位操作，我决定稍微刷新一下我的浮点知识!

在我看到这个之前，一切都很好:

... 23 fraction bits of the significand appear in the memory format but the total precision is 24 bits

我一遍又一遍地阅读它，但我仍然无法弄清楚第 24 位在哪里，我注意到一些关于 binary point 的东西，所以我假设它是 尾数 和指数。

我不太确定，但我相信他的作者在谈论这一点:

         Binary point?
             |
s------e-----|-------------m----------
0 - 01111100 - 01000000000000000000000
           ^ this

最佳答案

由于归一化，第 24^th 位是隐式的。

有效数向左移动(并且每次移位从指数中减去一个)直到有效数的前导位为 1。

然后，由于前导位是 1，所以实际上只存储了其他 23 位。

也有可能是非正规数。指数存储为“偏差”格式的有符号数，这意味着它是一个无符号数，其中范围的中间值定义为 0¹。因此，对于 8 位，它存储为 0..255 之间的数字，但 0 被解释为 -128，128 被解释为 0，255 被解释为 127(我可能在那里有一个栅栏错误，但你明白了)。

如果在归一化过程中将其递减为 0(表示实际指数值为 -128)，则归一化停止，有效数按原样存储。在这种情况下，归一化的隐式位为 0 而不是 1。

大多数浮点硬件设计为基本上假设数字将被归一化，因此它们假设隐式位为 1。在计算期间，它们检查非正规数的可能性，在这种情况下它们大致等效抛出异常，并在考虑到这一点的情况下重新开始计算。这就是为什么 computation with denormals often gets drastically slower than otherwise .

如果您想知道它为什么使用这种奇怪的格式:IEEE float (与许多其他格式一样)旨在确保如果您将其位模式视为相同大小的整数，则可以将它们与带符号的 2 的补码进行比较整数，它们仍然会按照 float 的正确顺序排序。由于数字的符号位于最高有效位(用于 2 的补码整数)，因此被视为符号位。指数的位存储为下一个最高有效位——但如果我们对它们使用 2 的补码，则小于 0 的指数将设置数字的第二个最高有效位，这将导致看起来像一个大数字作为一个整数。通过使用偏差格式，较小的指数使该位清零，较大的指数设置它，因此整数阶反射(reflect)了 float 阶。

关于c++ - 单精度 float 的第 24 个小数位在哪里？ IEEE 754，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18237150/

25

4

0

文章推荐： c++ - 如何将 vector 大小与整数进行比较？

文章推荐： c++ - 如何在 c/c++ 应用程序中列出所有环境变量

delphi - 单精度、 double 和精度
我知道存储单个值(或 double 值)不可能非常精确。因此，例如存储 125.12 可能会得到 125.1200074788。现在在delphi中，它们是一些有用的函数，例如samevalue或co
algorithm - IEEE754 单精度 - 表示数字一半的通用算法
假设 N 是根据 IEEE754 单精度标准表示的任意数字。我想在 IEEE754 中再次找到 N/2 的最精确可能表示。我想找到一个通用算法(用文字描述，我只想考虑必要的步骤和情况)来获得表示。
c - 单精度 float 在零附近时的近似分辨率是多少
我将许多经度和纬度存储为 doubles，我想知道我是否可以将它们存储为 floats。要回答这个问题，我需要知道 single precision floating point number 的近
单精度 IEEE 754 float 的格式
我需要以一种不会丢失任何信息的方式将单精度数字表示为文本(这样我就可以得到相同的数字，可能会忽略 NaN 等)，但没有太多的伪数字 - 所以单精度 0.1 出来了“0.1”不是“0.100000001
c - 单精度 float 乘以 2
这是一个家庭作业问题。我已经在网上找到了很多代码，包括StackOverflow中的一些代码。但我只想要概念而不是代码。我想自己实现。所以我要实现的功能是: float_twice - 返回浮点参数
c++ - IBM 单精度 float 据转换为预期值
我需要从二进制文件中读取值。数据格式为 IBM 单精度 float (4 字节十六进制指数数据)。我有 C++ 代码从文件中读取并取出每个字节并像这样存储它 unsigned char buf[BU
c++ - IBM 单精度 float 据转换为预期值
我需要从二进制文件中读取值。数据格式为 IBM 单精度 float (4 字节十六进制指数数据)。我有 C++ 代码从文件中读取并取出每个字节并像这样存储它 unsigned char buf[BU
c - 如何仅使用整数算术生成 IEEE 754 单精度 float ？
假设低端微处理器没有浮点运算，我需要生成一个 IEE754 单精度浮点格式数字以推送到文件。我需要编写一个函数，它接受三个整数(符号、整数和分数)，并返回一个字节数组，其中 4 个字节是 IEEE
python - 将二进制字符串转换为 IEEE-754 单精度 - Python
我有一个由 NumPy 创建的二进制矩阵。该矩阵有 5 行和 32 列。 array([[1, 1, ..., 1, 1], [0, 1, ..., 0, 1], [1, 1, ...,
python - 如何在不设置第 23 位的情况下在 python 中创建自定义 NaN(单精度)？
我正在尝试通过选择分数位来创建浮点 NaN。但似乎 python float 在解释 NaN 时总是设置第 23 个小数位(IEEE754 单)。所以，我的问题是:是否可以在不设置第 23 位的情
java - 从 IEEE 754 单精度(32 位)浮点列表创建字节流
有没有办法转换 IEEE 单精度(32 位)列表: String result = getdata(); String[] floats = result.split(","); List float
types - 为什么 IEEE754 单精度 float 只有 7 位精度？
为什么单精度 float 具有 7 位精度(或 double 15-16 位精度)？谁能解释一下我们是如何根据分配给 float(Sign(32) Exponent(30-23), Fraction
c++ - 单精度 float 的第 24 个小数位在哪里？ IEEE 754
今天我发现自己在做一些位操作，我决定稍微刷新一下我的浮点知识! 在我看到这个之前，一切都很好: ... 23 fraction bits of the significand appear in th
c - 如何检查是否使用了 IEEE 754 单精度(32 位)浮点表示法？
我想在我的目标板上测试以下内容: 'float' 是使用 IEEE 754 单精度(32 位)浮点变量实现的吗？ 'double' 是否使用 IEEE 754 double (64 位)浮点变量实现？
floating-point - IEEE-754 32 位(单精度)指数 -126 而不是 -127
我知道我是否有这样的号码: 1 | 1001 0001 | 0011 0011 0000 0001 0101 000 1 sign bit | 8 bit biased exponent | 23
java - 在 Java 中获取(十进制) float 的 IEEE 754(单精度)表示
我确定我遗漏了一些东西。我使用这个代码: int bitsVal = Float.floatToIntBits(f); String bitsString = Integer.toString(bit
ms-access - Access 查询的 CSV 导出将浮点(单精度/ double )值限制为小数点后 2 位
我花了几个小时将小数位数更改为 8，而不是使用 VBA Access 的 2。我找到了一些使用此标签来更改系统属性的解决方案: 公共(public)常量 LOCALE_ILZERO = &H12 但它

首页

博学

6Ren·AI

商城

c++ - 单精度 float 的第 24 个小数位在哪里？ IEEE 754