math - 对于 IEEE-754 浮点运算，尾数是在 [0.5, 1) 还是 [1, 2) 中？-6ren

math - 对于 IEEE-754 浮点运算，尾数是在 [0.5, 1) 还是 [1, 2) 中？

转载作者：行者123 更新时间：2023-12-01 23:22:32

30

4

我在看几本教科书，包括 Trefethen 和 Bau 的数值线性代数，在浮点运算部分，他们似乎说在 IEEE-754 中，归一化 float 采用形式 .1.... X 2^e。即，假设尾数在 0.5 到 1 之间。

但是，在这个popular online floating point calculator , 说明归一化 float 的尾数在 1 和 2 之间。

谁能告诉我哪个是正确的方法？

最佳答案

所有的方法都是正确的。以下集合是相同的:

{ (−1)^s•f•2^e | s ∈ {0, 1}，f为24位二进制数，第一个数字后有小数点，e 是满足 −126 ≤ e ≤ 127 } 的整数。
{ (−1)^s•f•2^e | s ∈ {0, 1}, f 是第一个数字前有小数点的24位二进制数的值，e 是满足 −125 ≤ e ≤ 128 } 的整数。
{ (−1)^s•f•2^e | s ∈ {0, 1}，f为最后一位后带小数点的24位二进制数的值，e 是满足 −149 ≤ e ≤ 104} 的整数。
{ f•2^e | f 是一个整数，使得 |f| < 2²⁴，e 是满足 −149 ≤ e ≤ 104 } 的整数。

换句话说，我们可以将小数点放在我们想要的有效数字的任何位置，只需通过调整指数的范围来补偿即可。可以根据方便或偏好选择使用哪种形式。

第三种形式对有效数进行缩放，使其成为整数，第四种形式将符号合并到有效数中。这种形式便于使用数论分析浮点行为。

IEEE 754 多采用第一种形式。它将此称为“一种科学形式”，反射(reflect)了这样一个事实，即在科学记数法中，我们通常在第一位数字后面写一个小数点，如“地球的质量约为 5.9722•10^{24 公斤。”在第 3.3 条中，IEEE 754-2008 提到“出于某些目的，将有效数字视为整数也很方便；在这种情况下，有限 float 是这样描述的:”，后跟等同于上面第三种形式的文本，除了它是通用的(基数和其他参数是任何浮点格式的任意值，而不是我使用的常量以上专门针对 binary32 格式)。}

C 标准以第二种形式描述数字(对于任何基数，不一定是二)，小数点在第一个数字之前，其 frexp 函数提供的指数与此比例匹配.

关于math - 对于 IEEE-754 浮点运算，尾数是在 [0.5, 1) 还是 [1, 2) 中？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67797756/

30

4

0

文章推荐： html - 如何防止 li 文本进入按钮下方

文章推荐： python - 对 Pandas 数据框执行拆分并创建一个新框架

文章推荐： Java XMLGregorianCalendar 正在改变时间 - 奇怪的行为

ieee-754 - IEEE 754 浮点除法或减法本身是否总是产生相同的值？
除非 IEEE 754 是 NaN、+-0.0 或 +-Infinity，否则自除是否保证结果正好是 1.0？同样，减去本身是否保证总是导致 +-0.0？最佳答案 IEEE 754-2008 4.
ieee-754 - 将科学记数法的十进制数转换为 IEEE 754
我已经阅读了一些文本和线程，展示了如何从十进制转换为 IEEE 754，但我仍然对如何在不扩展小数(以科学计数法表示)的情况下转换数字感到困惑我特别使用的数字是9.07 * 10^23，但任何数字都
ieee-754 - IEEE 754 中的指数
为什么 float 中的指数要置换 127？那么，真正的问题是:与 2 的补码相比，这种表示法有什么优势？最佳答案由于存储的指数是无符号的，因此可以使用整数指令来比较浮点值。为了比较(不是补码)
ieee - Mendeley 的标准 IEEE CSL 文件创建了不正确的引用书目
我一直在使用 Mendeley 的 Microsoft Word 插件轻松引用我的 Mendeley 桌面图书馆中的论文。但是，我注意到 IEEE 格式的引用书目/引文在引用 session 记录和
ieee-754 - 哪些语言符合 IEEE 754 标准？
我花了一周的时间研究这个主题，发现没有语言能够正确满足 IEEE 754 规范。甚至 GCC 也不尊重相关的 C99 部分(它忽略了 FENV_ACCESS 编译指示，并且我被告知我的工作示例纯粹是
ieee-754 - IEEE 754 float 中的 754 是什么意思？
有很多 IEEE 标准。几乎所有语言都保证实现 IEEE 754 二进制 float 。最佳答案我认为这只是流水号，就像 IRC 有 RFC1459 关于ieee-754 - IEEE 754 f
c - 十进制到 IEEE 754 使用 C 的单精度 IEEE 754 代码
我们在类里面有一个作业，要使用 c 从十进制转换为单精度，但我完全迷失了。这是作业: The last part of this lab involves coding a short c algo
ieee-754 - IEEE 754 binary16 半 float 的类似 float.h 的定义
我使用的是在 SoftFloat 库中实现的半 float (阅读:100% IEEE 754 兼容)，为了完整起见，我希望为我的代码提供与 float.h> 用于 float、double 和 lo
rounding - IEEE 754舍入为正无穷大
我很难理解IEEE 754舍入约定: 四舍五入为正无穷大四舍五入为负无穷大无偏到最接近的偶数如果我在二进制点的右边有一个由9位组成的二进制数，并且我需要使用最右边的3位来确定舍入该怎么办？这是
standards - IEEE 软件标准
关闭。这个问题需要更多focused .它目前不接受答案。想改善这个问题吗？更新问题，使其仅关注一个问题 editing this post . 4年前关闭。 Improve this questi
c - IEEE 浮点表示
我创建了以下程序来查找 float 的位模式。但我的计算结果有所不同: #include int main(void){ float f = 1.234; char *ch;
在非 IEEE 浮点实现中更改尾数的宽度
我在 18 位软核处理器目标上有一个 gcc 交叉编译器定义了以下数据类型:18 位整数、36 位长整型和 36 位 float (单精度)。现在我的重点是浮点运算。由于宽度是非标准(36位)，我有以
c - IEEE 单精度浮点格式
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 8 年前。 Improve th
c++ - IEEE 浮点和内存中的快速浮点表示
Analog Devices 的 BFF-533 处理器不提供原生浮点支持，但提供浮点仿真。使用 IDE VisualDSP++，用户可以在高性能浮点和严格的 IEEE 合规性之间进行选择。据我了
c++ - IEEE 浮点与自定义浮点性能
我在没有浮点单元的处理器上工作，所以我必须为用户界面使用固定或自定义浮点类型。对于这三种类型，say a multiply 的性能如何: IEEE float (32) 具有 16 位有符号值和有符
floating-point - IEEE 浮点标准中指数和尾数大小的基本原理是什么？
我对浮点数的工作原理有很好的理解，但我想知 Prop 体的指数和尾数大小是如何决定的。它们在某些方面是最优的吗？如何测量浮点表示的最优性(我假设有几种方法)？我想这些问题在官方标准中得到了解决，但我无
floating-point - IEEE-754数据的压缩算法
任何人都建议使用良好的压缩算法，该算法可与 double 浮点值一起很好地工作？我们发现，对于浮点值的二进制表示，使用常见的压缩程序(例如Zip，RAR，7-Zip等)会导致非常差的压缩率。我们需要
assembly - IEEE 754 非规范化十进制转换为半点二进制
我正在尝试将 0.0000211 转换为二进制。目前我的理解是这样的: E = -偏差 + 1。偏差 = 15，E = -14 符号位和指数 = 0。所以我有: 0 00000 ?????????
assembly - IEEE 754 有多少个整数
我试图找出 ieee 754 中存在多少个不同的整数。我得到的数字是 1778384895，但我找不到任何资源来检查自己。预先非常感谢。最佳答案我将假设单精度 float 。我们得到了零，虽然可
c++ - 执行两次时产生不同结果的相同浮点计算是否表明不符合 IEEE 754？
在运行 32 位 GCC 7.3.0 的特定在线判断中，这个: #include volatile float three = 3.0f, seven = 7.0f; int main() {

首页

博学

6Ren·AI

商城

math - 对于 IEEE-754 浮点运算，尾数是在 [0.5, 1) 还是 [1, 2) 中？