gpt4 book ai didi

c++ - 为什么 Clang 优化掉 x * 1.0 而不是 x + 0.0?

转载 作者:行者123 更新时间:2023-12-01 16:30:13 31 4
gpt4 key购买 nike

为什么 Clang 优化掉了这段代码中的循环

#include <time.h>
#include <stdio.h>

static size_t const N = 1 << 27;
static double arr[N] = { /* initialize to zero */ };

int main()
{
clock_t const start = clock();
for (int i = 0; i < N; ++i) { arr[i] *= 1.0; }
printf("%u ms\n", (unsigned)(clock() - start) * 1000 / CLOCKS_PER_SEC);
}

但不是此代码中的循环?
#include <time.h>
#include <stdio.h>

static size_t const N = 1 << 27;
static double arr[N] = { /* initialize to zero */ };

int main()
{
clock_t const start = clock();
for (int i = 0; i < N; ++i) { arr[i] += 0.0; }
printf("%u ms\n", (unsigned)(clock() - start) * 1000 / CLOCKS_PER_SEC);
}

(标记为 C 和 C++ 因为我想知道每个答案是否不同。)

最佳答案

IEEE 754-2008 浮点运算标准和 ISO/IEC 10967 Language Independent Arithmetic (LIA) Standard, Part 1回答为什么会这样。

IEEE 754 § 6.3 The sign bit

When either an input or result is NaN, this standard does not interpret the sign of a NaN. Note, however, that operations on bit strings — copy, negate, abs, copySign — specify the sign bit of a NaN result, sometimes based upon the sign bit of a NaN operand. The logical predicate totalOrder is also affected by the sign bit of a NaN operand. For all other operations, this standard does not specify the sign bit of a NaN result, even when there is only one input NaN, or when the NaN is produced from an invalid operation.

When neither the inputs nor result are NaN, the sign of a product or quotient is the exclusive OR of the operands’ signs; the sign of a sum, or of a difference x − y regarded as a sum x + (−y), differs from at most one of the addends’ signs; and the sign of the result of conversions, the quantize operation, the roundTo-Integral operations, and the roundToIntegralExact (see 5.3.1) is the sign of the first or only operand. These rules shall apply even when operands or results are zero or infinite.

When the sum of two operands with opposite signs (or the difference of two operands with like signs) is exactly zero, the sign of that sum (or difference) shall be +0 in all rounding-direction attributes except roundTowardNegative; under that attribute, the sign of an exact zero sum (or difference) shall be −0. However, x + x = x − (−x) retains the same sign as x even when x is zero.



添加的情况

默认舍入模式下 (舍入到最近,并列到偶数),我们看到 x+0.0生产 x , 除非 x-0.0 :在这种情况下,我们有两个符号相反的操作数的和,它们的和为零,第 6.3 节第 3 段规则此加法产生 +0.0 .

+0.0与原始 -0.0 按位不相同,以及 -0.0是可能作为输入出现的合法值,编译器必须放入将潜在负零转换为 +0.0 的代码。 .

总结:默认舍入模式下,在 x+0.0 , 如果 x
  • 不是 -0.0 ,然后 x本身就是一个可接受的输出值。
  • -0.0 ,那么输出值一定是 +0.0 ,这与 -0.0 按位不同.

  • 乘法的例子

    默认舍入模式下 , x*1.0 不会出现这样的问题.如 x :
  • 是(子)正规数,x*1.0 == x总是。
  • +/- infinity ,那么结果是 +/- infinity同一个标志。
  • NaN ,那么根据

    IEEE 754 § 6.2.3 NaN Propagation

    An operation that propagates a NaN operand to its result and has a single NaN as an input should produce a NaN with the payload of the input NaN if representable in the destination format.



    这意味着 NaN*1.0 的指数和尾数(虽然不是符号)建议与输入 NaN 保持不变.根据上面的第 6.3p1 节未指定符号,但实现可能指定它与源 NaN 相同。 .
  • +/- 0.0 ,那么结果是 0其符号位与 1.0 的符号位异或,与§6.3p2 一致。由于1.0的符号位是 0 ,输出值与输入值不变。因此,x*1.0 == x即使 x是(负)零。

  • 减法案例

    默认舍入模式下 ,减法 x-0.0也是一个空操作,因为它等价于 x + (-0.0) .如 x
  • NaN ,那么 §6.3p1 和 §6.2.3 的适用方式与加法和乘法大致相同。
  • +/- infinity ,那么结果是 +/- infinity同一个标志。
  • 是(子)正规数,x-0.0 == x总是。
  • -0.0 ,然后根据 §6.3p2 我们有“[...] 和的符号,或被视为和 x + (-y) 的差 x - y 的符号,与最多一个加数的符号不同;” .这迫使我们分配 -0.0作为 (-0.0) + (-0.0) 的结果, 因为 -0.0与无加数的符号不同,而 +0.0 的符号不同两个的增补,违反了本条款。
  • +0.0 ,那么这简化为加法情况 (+0.0) + (-0.0)上面在加法的情况下考虑过,根据第 6.3p3 节的规定,它被裁定为 +0.0 .

  • 由于对于所有情况,输入值作为输出都是合法的,因此可以考虑 x-0.0无操作,和 x == x-0.0同义反复。

    改变值(value)的优化

    IEEE 754-2008 标准有以下有趣的引用:

    IEEE 754 § 10.4 Literal meaning and value-changing optimizations

    [...]

    The following value-changing transformations, among others, preserve the literal meaning of the source code:

    • Applying the identity property 0 + x when x is not zero and is not a signaling NaN and the result has the same exponent as x.
    • Applying the identity property 1 × x when x is not a signaling NaN and the result has the same exponent as x.
    • Changing the payload or sign bit of a quiet NaN.
    • [...]


    由于所有 NaN 和所有无穷大共享相同的指数,以及 x+0.0 的正确舍入结果和 x*1.0对于有限 xx 的震级完全相同,它们的指数相同。

    纳米

    信号 NaN 是浮点陷阱值;它们是特殊的 NaN 值,用作浮点操作数会导致无效操作异常 (SIGFPE)。如果触发异常的循环被优化掉,软件的行为将不再相同。

    但是,作为 user2357112 points out in the comments ,C11 标准明确未定义信号 NaN ( sNaN ) 的行为,因此允许编译器假设它们不会发生,因此它们引发的异常也不会发生。 C++11 标准省略了对 NaN 信号行为的描述,因此也未定义。

    舍入模式

    在交替舍入模式中,允许的优化可能会改变。例如,在 下舍入到负无穷 模式,优化 x+0.0 -> x变得允许,但 x-0.0 -> x变得禁止。

    为了防止 GCC 采用默认的舍入模式和行为,实验标志 -frounding-math可以传递给GCC。

    结论

    Clang 和 GCC ,即使在 -O3 , 仍然符合 IEEE-754。这意味着它必须遵守 IEEE-754 标准的上述规则。 x+0.0位不相同 x所有 x在这些规则下,但是 x*1.0可以选择这样:即,当我们
  • 遵守建议以不变的方式传递 x 的有效负载当它是 NaN 时。
  • 保持 NaN 结果的符号位不变 * 1.0 .
  • x 时,遵守在商/乘积期间对符号位进行异或的顺序不是 NaN。

  • 启用 IEEE-754 不安全优化 (x+0.0) -> x ,国旗 -ffast-math需要传递给 Clang 或 GCC。

    关于c++ - 为什么 Clang 优化掉 x * 1.0 而不是 x + 0.0?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33272994/

    31 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com