gpt4 book ai didi

gcc - 了解 gcc 生成的优化汇编代码

转载 作者:行者123 更新时间:2023-12-02 21:48:38 32 4
gpt4 key购买 nike

我试图了解设置 -O3 标志时 gcc 执行哪种优化。我很困惑这两行是什么,

xor %esi, %esi
lea 0x0(%esi), %esi

在我看来这是多余的。这里使用 lea 指令有什么意义?

最佳答案

该指令用于填充空间以实现对齐目的。当循环在对齐的地址上开始时,它们会更快,因为处理器将内存加载到解码器中。通过对齐循环和函数的开头,它们更有可能位于这些 block 之一的开头。这可以防止加载先前不会使用的指令,最大化 future 指令的数量,并且可能最重要的是,确保第一条指令完全位于第一个 block 中,因此不需要两次加载来执行它.

编译器知道最好对齐循环,并且有两个选项可以做到这一点。它可以跳转到循环的开头,也可以用无操作填充间隙并让处理器流过它们。跳转指令会破坏指令流,并经常导致现代处理器上的周期浪费,因此不必要地添加它们是不可取的。对于像这样的短距离,不进行任何操作会更好。

x86 架构包含一条专门用于不执行任何操作的指令 nop。然而,这是一个字节长,因此需要多个字节来对齐循环。解码每条指令并确定它没有任何作用需要时间,因此简单地插入另一条没有副作用的较长指令会更快。因此,编译器插入了您所看到的 lea 指令。它绝对没有任何影响,并且由编译器选择以具有所需的精确长度。事实上,最新的处理器具有标准的多字节无操作指令,因此这可能会在解码过程中被识别,甚至永远不会被执行。

关于gcc - 了解 gcc 生成的优化汇编代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19085663/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com