- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我一直在研究将 float ( float 和 double )转换为 IEEE 754 的方法,目的是创建例程以通过网络连接有效地发送/接收信息。 (类似于 perl pack/unpack 函数。)我已经通过 Lockless 了解了创建 IEEE 754 表示的方法。 , technical-recipes.com , Bit Twiddling , Bitwizardry , Haskell.org (c++)等等,但我不明白为什么这些方法比仅使用 union 来获得转换更快/更有效/更好?涉及整数/ float 或长/ double 的并集转换似乎是让 C 处理符号、指数和尾数的好方法,而不是手动进行移位和旋转。
例如,通过位旋转,您可以手动创建 IEEE 754 表示:
/* 23 bits of float fractional data */
#define I2F_FRAC_BITS 23
#define I2F_MASK ((1 << I2F_FRAC_BITS) - 1)
/* Find the log base 2 of an integer (MSB) */
int
getmsb (uint32_t word)
{
int r;
#ifdef BUILD_64
union { uint32_t u[2]; double d; } t; // temp
t.u[__FLOAT_WORD_ORDER==LITTLE_ENDIAN] = 0x43300000;
t.u[__FLOAT_WORD_ORDER!=LITTLE_ENDIAN] = word;
t.d -= 4503599627370496.0;
r = (t.u[__FLOAT_WORD_ORDER==LITTLE_ENDIAN] >> 20) - 0x3FF;
#else
while (word >>= 1)
{
r++;
}
#endif /* BUILD_64 */
return r;
}
/* rotate to right */
inline uint32_t
rotr (uint32_t value, int shift)
{ return (value >> shift) | (value << (sizeof (value) * CHAR_BIT - shift)); }
/* unsigned to IEEE 754 */
uint32_t
u2ieee (uint32_t x)
{
uint32_t msb, exponent, fraction;
if (!x) return 0; /* Zero is special */
msb = getmsb (x); /* Get location of the most significant bit */
fraction = rotr (x, (msb - I2F_FRAC_BITS) & 0x1f) & I2F_MASK;
exponent = (127 + msb) << I2F_FRAC_BITS;
return fraction + exponent;
}
/* signed int to IEEE 754 */
uint32_t i2ieee (int32_t x)
{
if (x < 0)
return u2ieee (-x) | 0x80000000;
return u2ieee (x);
}
此时您可以将其转换为十六进制或二进制字符串,将其放入一个数据包并在另一端反向执行该过程。 (注意,这只是针对 32 位的情况,64 位数字需要类似的功能。)为什么要这样做?为什么不将 float 或 double 放入自动存储在 IEEE 754 表示中的 union 中,然后简单地使用 int 或 long 表示?似乎所有情况都可以通过以下似乎不太容易出错的方式处理:
union uif { int i; float f; };
union uid { long int i; double d; };
int
f2ieee (float f) {
union uif cvt;
cvt.f = f;
return cvt.i;
}
float
ieee32f (int i) {
union uif cvt;
cvt.i = i;
return cvt.f;
}
long
d2ieee64 (double d) {
union uid cvt;
cvt.d = d;
return cvt.i;
}
double
ieee64d (long int i) {
union uid cvt;
cvt.i = i;
return cvt.d;
}
所有这些都是很好的学习,但我错过了最重要的部分。为什么要用一种方式而不是另一种方式?当简单地从 union 中读取时,手动转换有什么好处,它更不容易出错,而且表面上看起来效率更高?专家怎么说?
最佳答案
您建议的“更简单”代码与您建议替换的代码的作用不同。您的代码是将机器 float (可能不是 IEEE 格式)转换为具有相同表示 的相同大小的无符号整数的正确方法。您不喜欢的“位运算”代码是(如果我理解正确的话)手动计算与给定整数具有相同数值 的 IEEE 格式 float 。这两种操作都很有用,但在不同的上下文中。例如,我希望在 fpclassify
的实现中看到您建议的代码在具有硬件 IEEE 浮点但没有特殊指令对值进行分类的 CPU 上,以及为根本没有硬件浮点的机器实现软件浮点库时的“位旋转”代码。
使用位字段提取浮点值的字段是不安全的,因为 C 标准规定位字段被打包到结构<中的顺序
是实现定义的(N1570:6.7.2.1p11),这意味着编译器可以选择他们喜欢的任何顺序。他们应该记录他们所做的事情,但他们不必选择“有意义”的顺序,特别是,如果您编写一个 struct
带有与符号对应的位域, IEEE 浮点值的指数和尾数字段,您可以不依赖于那些与实际 IEEE 浮点值的字段对齐的位字段的跨平台。确实有一些编译器,例如,以与 objective-c PU 的浮点单元预期方向相反的方向打包位域。
现在,就标准的字面意义而言,如果您使用移位和掩码来提取字段,这个问题会让您更糟,因为您从 float 转换中获得的值-point value to the same-size unsigned integer that you hope have the same representation is unspecified (N1570: 6.2.6.1p7),它比实现定义的更明确(但比实现定义的更明确)不明确的)。但是,在实践中,这样做更有可能奏效。 (我只能想到一个完全过时的上下文,它无法工作:1990 年代初期的一些基于 ARM 的系统具有大端的第三方浮点协处理器,与主 CPU 对整数的选择相反值。相比之下,许多编译器对位域使用了“错误”的顺序;甚至已知它会在较小的升级时发生变化。)
(找个时间看看 Ada 的“表示子句”,看看它真正需要什么来让程序员能够将记录类型与内存中位排列的外部规范对齐.C 甚至没有接近。)
(如果您只想将具有相同值的整数转换为 float ,并且您没有实现编译器后端的任务,则可以通过简单的赋值来完成:double x = 1123581321;
换个方向,您可能正在寻找 lrint
及其 friend 。)
关于c - 为什么 IEEE 754 浮点格式不使用 union ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23917861/
这个问题已经有答案了: Invalid types 'double [100][double]' for array subscript (3 个回答) 已关闭 6 年前。 我已复制下面的整个代码并在
您有 2 个功能; f(x)= x(((x+1)^(1/2))-(x^(1/2))) g(x)= x/(((x+1)^(1/2))+(x^(1/2))) 哪个更准确? 旁注:如果你能解释为什么,
我正在从事一个关于java的研究项目,其中必须完成一些艰难的计算。然而,我已经完成了大部分工作,但停留在某个点上。我必须计算以下内容: (2.1-2.3) raised to power 0.3. 但
int main() { float x = 50; float y = 1/x; float result = y * x; float test = 41;
有没有安全的方法来可靠地确定整数类型 T可以存储浮点整数值 f (所以 f == floor(f) )没有任何溢出? 请记住,不能保证浮点类型 F与 IEC 559 (IEEE 754) 兼容,并且有
// value will always be in the range of [0.0 - maximum] float obtainRatio(float value, float maximum
就在今天,我遇到了我们正在使用的第三方软件,在他们的示例代码中,有以下内容: // Defined in somewhere.h static const double BAR = 3.14; //
是否有推荐的方法来清除 jQuery Flot 图表?我在 API 引用中找不到任何内容。 最佳答案 “清除”是指“破坏整个图表”还是只是清除数据? 要核对整个图表:$('#canvas_id').e
我正在学习单精度并想了解错误传播。根据this nice website ,加法是一个危险的操作。 所以我编写了一个小的 C 程序来测试错误累积的速度。我不完全确定这是否是一种有效的测试方法。如果是,
我正在尝试查询数据库,我需要获取权重等于 60.5 的客户列表。问题是 60.5 是一个实数,我以前从未在 where 子句中使用实数查询过数据库。 我已经尝试过这个: SELECT Name FRO
这是我的“ProjectEntity”类中的代码部分(我在其中使用 hibernate 进行 SQL 调用) @Column(name = "BUDGET") private float budget
我用 Haskell 编写了一个应用程序,它调用 Z3 求解器来解决一些复杂公式的约束。感谢 Haskell,我可以快速切换正在使用的数据类型。 当使用 SBV 的 AlgReal 类型进行计算时,我
在 C 中 double/float 有一个集合类型说明符:%f %F %g %G %e %E .有什么区别吗 %f和 %F , %g和 %G , %e和 %E ? 根据 printf和 scanf输
我正在开发一个适用于 Android 的可视化应用程序(包括运行 Android 2.2 的旧设备)。 我的应用程序的输入模型包含一个区域,该区域通常由数万个顶点组成。典型模型有 50000-1000
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 6 年前。 Improve this ques
我被要求编写一个程序来查找我大学中两个输入的总和,因此我应该首先检查输入是否有效。 例如,如果我输入 2534.11s35,程序应该检测到它不是该程序的有效输入,因为输入中存在 s。 最佳答案 to
我正在尝试降低 FPGA 的逻辑利用率,但在网上找不到任何好的 float fastpow。我所说的“好”是指充分减少所使用的逻辑。如果我使用双版本我几乎没有什么改进。如果我使用其他依赖日志的 flo
我有一个 128 字节的内存位置。我尝试用从 1...127 开始的数据填充内存。 我需要编写一个代码来获取两个参数,如偏移量、数据类型。根据参数,我需要将内存中的数据转换为提到的特定数据类型。 举个
我希望能够做到以下几点: float func() { if( error ) return InvalidFloatingPointValue; else return 0.0f;
假设我有两个 float ,我想比较它们。如果一个大于另一个,程序应该采用一个 fork。如果情况正好相反,它应该走另一条路。并且它应该做同样的事情,如果被比较的值在一个仍然应该使它比较真实的方向上被
我是一名优秀的程序员,十分优秀!