gpt4 book ai didi

c++ - 这是优化器的怪癖还是语言规则禁止优化的结果?

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:39:45 26 4
gpt4 key购买 nike

我在玩编译器资源管理器时发现这两个函数在 gcc 和 clang 中生成不同的程序集。我预计在内联后它们会产生相同的表达式树,从而产生相同的最佳装配。

constexpr bool is_nonzero_decimal_digit(char const c) noexcept
{
return c == '1' || c == '2' || c == '3' || c == '4' || c == '5'
|| c == '6' || c == '7' || c == '8' || c == '9';
}

bool is_decimal_digit_v1(char const c) noexcept
{
return c == '0' || is_nonzero_decimal_digit(c);
}

bool is_decimal_digit_v2(char const c) noexcept
{
return c == '0' || c == '1' || c == '2' || c == '3' || c == '4'
|| c == '5' || c == '6' || c == '7' || c == '8' || c == '9';
}

Clang 3.9.1 -std=c++1z -O3 结果

is_decimal_digit_v1(char):
cmp dil, 48
sete cl
add dil, -49
cmp dil, 9
setb al
or al, cl
ret

is_decimal_digit_v2(char):
add dil, -48
cmp dil, 10
setb al
ret

gcc 6.3 -std=c++1z -O3 结果

is_decimal_digit_v1(char):
cmp dil, 48
je .L3
sub edi, 49
cmp dil, 8
setbe al
ret
.L3:
mov eax, 1
ret

is_decimal_digit_v2(char):
sub edi, 48
cmp dil, 9
setbe al
ret

那么,这是优化器的怪癖还是语言规则禁止优化的结果?

最佳答案

这是 gcc < 7.0 和 clang 优化器的一个怪癖。正如 Cornstalks 在评论中指出的那样,gcc 7.0 能够生成最佳汇编。我还检查了 VC++ 2015,它也是这样做的:

is_decimal_digit_v2:
sub cl, 48
cmp cl, 9
setbe al
ret 0
is_decimal_digit_v1:
sub cl, 48
cmp cl, 9
setbe al
ret 0

作为 T.C.指出,内联是在一些优化通过之后执行的,在这个特定的代码中,它将一系列比较合并到一个更简单的范围检查中。在内联之前这样做很有用,可以使叶函数更小,这反过来又增加了它们被内联的机会。基本上,v1 函数被转换成这样:

bool is_decimal_digit_v3(char const c) noexcept
{
if (c == 48) return true;
// this is what was inlined
char tmp = c - 49;
return tmp >= 0 && tmp < 9;
}

而 v2 被转换为更简单的形式:

bool is_decimal_digit_v4(char const c) noexcept
{
char tmp = c - 48;
return tmp >= 0 && tmp < 10;
}

为 v3 生成的程序集与为 v1 生成的程序集类似

#clang 3.9.1
is_decimal_digit_v3(char): # @is_decimal_digit_v3(char)
cmp dil, 48
sete cl
add dil, -49
cmp dil, 9
setb al
or al, cl
ret
# gcc 6.3
is_decimal_digit_v3(char):
cmp dil, 48
je .L8
sub edi, 49
cmp dil, 8
setbe al
ret
.L8:
mov eax, 1
ret

我想,要将 v3 转换为 v4,需要一些 gcc 7.0 能够完成的重要分析。此版本为所有四个片段生成完全相同的程序集:

is_decimal_digit_v1(char):
sub edi, 48
cmp dil, 9
setbe al
ret
is_decimal_digit_v2(char):
sub edi, 48
cmp dil, 9
setbe al
ret
is_decimal_digit_v3(char):
sub edi, 48
cmp dil, 9
setbe al
ret
is_decimal_digit_v4(char):
sub edi, 48
cmp dil, 9
setbe al
ret

有趣的是,VC++2015 无法将 v3 转换为 v4 并生成此程序集:

is_decimal_digit_v3:
cmp cl, 48
jne SHORT $LN2@is_decimal
mov al, 1
ret 0
$LN2@is_decimal:
xor eax, eax
sub cl, 49
cmp cl, 8
setbe al
ret 0

如果非要我猜的话,我会说它为 v1 而不是为 v3 生成最佳代码的原因是因为它在减少与范围检查的比较之前进行了内联。

关于c++ - 这是优化器的怪癖还是语言规则禁止优化的结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41576821/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com