gpt4 book ai didi

c++ - C++ 编译器是否对 lambda 闭包执行编译时优化?

转载 作者:可可西里 更新时间:2023-11-01 15:51:09 26 4
gpt4 key购买 nike

假设我们有以下(无意义的)代码:

const int a = 0;
int c = 0;
for(int b = 0; b < 10000000; b++)
{
if(a) c++;
c += 7;
}

变量 'a' 等于零,因此编译器可以在编译时推断出指令 'if(a) c++;'将永远不会被执行,并将对其进行优化。

我的问题:lambda 闭包是否也会发生同样的情况?

再看一段代码:

const int a = 0;
function<int()> lambda = [a]()
{
int c = 0;
for(int b = 0; b < 10000000; b++)
{
if(a) c++;
c += 7;
}
return c;
}

编译器会知道“a”为 0 并且会优化 lambda 吗?

更复杂的例子:

function<int()> generate_lambda(const int a)
{
return [a]()
{
int c = 0;
for(int b = 0; b < 10000000; b++)
{
if(a) c++;
c += 7;
}
return c;
};
}

function<int()> a_is_zero = generate_lambda(0);
function<int()> a_is_one = generate_lambda(1);

当编译器知道“a”在生成时为 0 时,它是否足够聪明来优化第一个 lambda?

gcc 或 llvm 有这种优化吗?

我问是因为我想知道当我知道在 lambda 生成时间满足某些假设或者编译器会为我做这些时我是否应该手动进行这样的优化。

最佳答案

查看 gcc5.2 -O2 生成的程序集表明使用 std::function 时没有发生优化:

#include <functional>

int main()
{
const int a = 0;
std::function<int()> lambda = [a]()
{
int c = 0;
for(int b = 0; b < 10000000; b++)
{
if(a) c++;
c += 7;
}
return c;
};

return lambda();
}

编译成一些样板和

    movl    (%rdi), %ecx
movl $10000000, %edx
xorl %eax, %eax
.p2align 4,,10
.p2align 3
.L3:
cmpl $1, %ecx
sbbl $-1, %eax
addl $7, %eax
subl $1, %edx
jne .L3
rep; ret

这是您希望优化掉的循环。 ( Live ) 但如果您实际使用 lambda(而不是 std::function),优化确实会发生:

int main()
{
const int a = 0;
auto lambda = [a]()
{
int c = 0;
for(int b = 0; b < 10000000; b++)
{
if(a) c++;
c += 7;
}
return c;
};

return lambda();
}

编译为

movl    $70000000, %eax
ret

即循环被完全删除。 ( Live )

Afaik,你可以期望 lambda 的开销为零,但是 std::function 是不同的并且会带来成本(至少在优化器的当前状态下,尽管人们显然在努力this),即使“std::function”中的代码已经被优化。 (对此持保留态度,如有疑问请尝试,因为这可能会因编译器和版本而异。std::function 的开销肯定可以被优化掉。)

正如@MarcGlisse 正确指出的那样,clang3.6 即使使用 std::function 也会执行所需的优化(相当于上面的第二种情况)。 ( Live )

额外的编辑,再次感谢@MarkGlisse:如果包含 std::function 的函数被称为main,优化gcc5.2 发生的事情介于 gcc+main 和 clang 之间,即函数被缩减为 return 70000000; 加上一些额外的代码。 ( Live )

奖金编辑 2,这次是我的:如果您使用 -O3,gcc 会(出于某种原因),如 Marco's answer 中所述。 , 将 std::function 优化为

cmpl    $1, (%rdi)
sbbl %eax, %eax
andl $-10000000, %eax
addl $80000000, %eax
ret

其余部分与 not_main 情况相同。所以我想在行的底部,使用 std::function 时只需要测量。

关于c++ - C++ 编译器是否对 lambda 闭包执行编译时优化?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32300165/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com