gpt4 book ai didi

c++ - GCC优化isnan(x)是否可行|| isnan(y) 变成 isunordered(x, y)?

转载 作者:IT老高 更新时间:2023-10-28 21:57:56 25 4
gpt4 key购买 nike

这是我的代码:

int f(double x, double y)
{
return std::isnan(x) || std::isnan(y);
}

如果您使用 C 而不是 C++,只需将 std:: 替换为 __builtin_(不要简单地删除 std:: , 原因如下:Why does GCC implement isnan() more efficiently for C++ <cmath> than C <math.h>? )。

这是程序集:

ucomisd %xmm0, %xmm0 ; set parity flag if x is NAN
setp %dl ; copy parity flag to %edx
ucomisd %xmm1, %xmm1 ; set parity flag if y is NAN
setp %al ; copy parity flag to %eax
orl %edx, %eax ; OR one byte of each result into a full-width register

现在让我们尝试一个替代的公式来做同样的事情:

int f(double x, double y)
{
return std::isunordered(x, y);
}

这是替代方案的程序集:

xorl    %eax, %eax
ucomisd %xmm1, %xmm0
setp %al

这太棒了——我们将生成的代码几乎减半!这是因为 ucomisd 设置奇偶校验标志,如果 either 它的操作数是 NAN,所以我们可以一次测试两个值,SIMD 样式。

你可以在野外看到类似原始版本的代码,例如:https://svn.r-project.org/R/trunk/src/nmath/qnorm.c

如果我们能让 GCC 足够聪明,可以在任何地方组合两个 isnan() 调用,那将是非常酷的。我的问题是:我们可以吗,怎么做?我对编译器的工作原理有一些了解,但我不知道在 GCC 的哪个位置可以执行这种优化。基本思想是,只要有一对 isnan()(或 __builtin_isnan)调用 OR'd 在一起,它应该发出单个 ucomisd同时使用两个操作数的指令。

编辑添加了一些由 Basile Starynkevitch 的回答提示的研究:

如果我使用 -fdump-tree-all 进行编译,我会找到两个看起来相关的文件。首先,*.gimple 包含以下内容(以及更多内容):

D.2229 = x unord x;
D.2230 = y unord y;
D.2231 = D.2229 | D.2230;

这里我们可以清楚地看到,GCC 知道它会将 (x, x) 传递给 isunordered()。如果我们想通过在这个级别进行转换来进行优化,那么规则大致是:“将 a unord a | b unord b 替换为 a unord b”。这是编译我的第二个 C 代码时得到的结果:

D.2229 = x unord y;

另一个有趣的文件是*.original:

return <retval> = (int) (x unord x || y unord y);

其实就是-fdump-tree-original生成的整个非注释文件。对于更好的源代码,它看起来像这样:

return <retval> = x unord y;

显然可以应用相同类型的转换(只是这里是 || 而不是 |)。

但不幸的是,如果我们将源代码修改为例如:

if (__builtin_isnan(x))
return true;
if (__builtin_isnan(y))
return true;
return false;

然后我们得到完全不同的 Gimple 和 Original 输出文件,尽管最终的组装和以前一样。所以也许在管道的后期尝试这种转变会更好? *.optimized 文件(以及其他文件)显示带有“if”的版本的代码与原始版本的代码相同,因此很有希望。

最佳答案

这种优化不仅是可能的,它现在在 gcc-6 中可用: https://gcc.gnu.org/viewcvs/gcc?view=revision&revision=222077

关于c++ - GCC优化isnan(x)是否可行|| isnan(y) 变成 isunordered(x, y)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26053934/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com