assembly - 为什么 clang 的结尾使用 `add $N, %rsp` 而不是 `mov %rbp, %rsp` 来恢复 `%rsp` ？-6ren

assembly - 为什么 clang 的结尾使用 `add $N, %rsp` 而不是 `mov %rbp, %rsp` 来恢复 `%rsp` ？

转载作者：行者123 更新时间：2023-12-04 16:36:28

26

4

考虑以下几点:

ammarfaizi2@integral:/tmp$ vi test.c
ammarfaizi2@integral:/tmp$ cat test.c

extern void use_buffer(void *buf);

void a_func(void)
{
    char buffer[4096];
    use_buffer(buffer);
}

__asm__("emit_mov_rbp_to_rsp:\n\tmovq %rbp, %rsp");

ammarfaizi2@integral:/tmp$ clang -Wall -Wextra -c -O3 -fno-omit-frame-pointer test.c -o test.o
ammarfaizi2@integral:/tmp$ objdump -d test.o

test.o:     file format elf64-x86-64


Disassembly of section .text:

0000000000000000 <emit_mov_rbp_to_rsp>:
   0: 48 89 ec              mov    %rbp,%rsp
   3: 66 2e 0f 1f 84 00 00  cs nopw 0x0(%rax,%rax,1)
   a: 00 00 00 
   d: 0f 1f 00              nopl   (%rax)

0000000000000010 <a_func>:
  10: 55                    push   %rbp
  11: 48 89 e5              mov    %rsp,%rbp
  14: 48 81 ec 00 10 00 00  sub    $0x1000,%rsp
  1b: 48 8d bd 00 f0 ff ff  lea    -0x1000(%rbp),%rdi
  22: e8 00 00 00 00        call   27 <a_func+0x17>
  27: 48 81 c4 00 10 00 00  add    $0x1000,%rsp
  2e: 5d                    pop    %rbp
  2f: c3                    ret    
ammarfaizi2@integral:/tmp$

在a_func()的最后，返回之前，是恢复%rsp的函数结语。它使用 add $0x1000, %rsp 产生 48 81 c4 00 10 00 00。

它不能只使用只产生 3 个字节的 mov %rbp, %rsp 48 89 ec 吗？

为什么 clang 不使用更短的方式 (mov %rbp, %rsp)？

在权衡代码大小的情况下，使用 add $0x1000, %rsp 而不是 mov %rbp, %rsp 有什么优势？

更新(额外)

即使使用 -Os，它仍然会产生相同的代码。所以我认为必须有一个合理的理由来避免 mov %rbp, %rsp。

ammarfaizi2@integral:/tmp$ clang -Wall -Wextra -c -Os -fno-omit-frame-pointer test.c -o test.o
ammarfaizi2@integral:/tmp$ objdump -d test.o

test.o:     file format elf64-x86-64


Disassembly of section .text:

0000000000000000 <emit_mov_rbp_to_rsp>:
   0:   48 89 ec                mov    %rbp,%rsp

0000000000000003 <a_func>:
   3:   55                      push   %rbp
   4:   48 89 e5                mov    %rsp,%rbp
   7:   48 81 ec 00 10 00 00    sub    $0x1000,%rsp
   e:   48 8d bd 00 f0 ff ff    lea    -0x1000(%rbp),%rdi
  15:   e8 00 00 00 00          call   1a <a_func+0x17>
  1a:   48 81 c4 00 10 00 00    add    $0x1000,%rsp
  21:   5d                      pop    %rbp
  22:   c3                      ret    
ammarfaizi2@integral:/tmp$

最佳答案

如果它完全使用 RBP 作为帧指针，是的，mov %rbp, %rsp 会更紧凑并且 AFAIK 至少在所有 x86 微体系结构上一样快。 (移动消除甚至可能适用于它)。当 add 常量不适合 imm8 时更是如此。

这可能是一个遗漏的优化，非常类似于https://bugs.llvm.org/show_bug.cgi?id=10319 (它建议使用 leave 而不是 mov/pop，这将在 Intel 上额外花费 1 个 uop，但又节省了 3 个字节)。它指出在正常情况下整体静态代码大小的节省非常小，但并未考虑效率优势。在正常构建中(-O2 没有 -fno-omit-frame-pointer)只有少数函数会使用帧指针(仅当使用 VLA/alloca 时，或者过度对齐堆栈)，因此可能的 yield 甚至更小。

从那个错误看来，它只是一个 LLVM 懒得去寻找的窥孔，因为许多函数还需要恢复其他寄存器，所以您实际上需要添加一些其他值到将 RSP 点在其他推送下方。

(GCC 有时使用 mov 来恢复调用保留的 reg，因此它可以使用 leave。使用帧指针，这使得寻址模式相当紧凑以进行编码，尽管一个 4 字节的 qword mov -8(%rbp), %r12 当然仍然没有 2 字节的 pop 小。如果我们没有帧指针(例如在 -O2 代码)，mov %rbp, %rsp 从来都不是一个选项。)

在考虑“不值得找”的理由之前，我想到了另一个小好处:

调用保存/恢复RBP的函数后，RBP为加载结果。所以在 mov %rbp, %rsp 之后， future 使用 RSP 需要等待加载。可能某些极端情况最终会在存储转发延迟方面成为瓶颈，而寄存器修改仅为 1 个周期。

但总的来说，这似乎不太值得额外的代码大小；我希望这种极端情况很少见。尽管 pop %rbp 需要那个新的 RSP 值，所以调用者恢复的 RBP 值是我们返回后两次加载链的结果。 (幸运的是 ret 有分支预测来隐藏延迟。)

因此，在某些基准测试中可能值得尝试这两种方式；例如在一些标准基准测试(如 SPECint)上将此与调整后的 LLVM 版本进行比较。

关于assembly - 为什么 clang 的结尾使用 `add $N, %rsp` 而不是 `mov %rbp, %rsp` 来恢复 `%rsp` ？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69385513/

26

4

0

文章推荐： r - 使用 Shiny 的 navbarPage 更改 sidebarPanel

文章推荐： shell - 在 shell 函数中 cat 一个文件

文章推荐： r - 如何将数据框的所有列转换为 R 中的单个列表？

clang - Clang 标志的完整文档在哪里？
我知道的引用资料在这里: http://clang.llvm.org/docs/ClangCommandLineReference.html http://clang.llvm.org/docs/Di
clang - clang-tidy 是否使 clang-check 变得多余？
这两个工具似乎有一些共同的目标，而 documentation of clang-tidy对其功能非常明确，clang-check's有点稀疏。如果我只能运行这些工具中的一个，同时进行相同的检查，那
clang - clang 使用哪个汇编器？
我不清楚 clang 使用的汇编器。 AFAIK native 又名 GNU 汇编器和链接器被使用(与 gcc 一起提供)。 clang -v main.c clang version 3.4.2 T
clang - Clang 标志的完整列表
在哪里可以找到 Clang 标志的完整列表？还有一些，例如 -include-pch，甚至没有在手册页中列出。 :( 我知道 GCC 使用一些相同的标志，但它不包含诸如 -Os 之类的文档，我相信这
clang - clang 编译器中的堆栈保护等价物？
大多数成熟的编译器似乎对堆栈变量破坏有很好的支持。海湾合作委员会:-fstack-protector xlC: -qstackprotect 英特尔:-fstackprotector window
clang - clang 的包含优先级是怎么回事？
我的命令: /usr/bin/c++ -fPIC -I/Users/me/project/include -I/usr/local/include/opencv \ -I/usr/local/incl
c++ - CLang Libtooling:在 clang::VarDecl、clang::FieldDecl 或 clang::ParmVarDecl 中获取变量的数据类型
我正在研究 CLang 3.5。我正在尝试获取有关在 C++ 项目中声明的变量的信息。如何获取 clang::VarDecl 中变量的数据类型或限定类名, clang::FieldDecl或 cla
clang - 如何为 Apple M1 构建 LLVM (clang,clang++)？
我正在尝试构建 LLVM 编译器，以便我可以在 Apple M1 上启用 OpenMP。我正在使用 LLVM 开发树，(因为我最近看到一些 OpenMP 运行时对此进行了处理)。我已经结束了这个脚
clang - Clang 如何找到它的默认 sysroot/target 三元组？ (clang-tidy 已停止工作)
背景: 在 Windows 10 PC 上，我有一个 C++ 代码库。使用 CMAKE 我生成了一个 Mingw-w64 项目(使用 Eclipse IDE)和一个 Visual Studio 201
linux - 我想通过使用 cmake 的正确程序检测 clang 来使用 clang/clang++ 进行编译
下面是我想做的。我想通过使用 cmake 的正确程序检测 clang 来使用 clang/clang++ 进行编译。请告诉我可以解决我将描述的问题的正确程序。 test environment:
clang - C++ 11 代码使用 `clang++` 编译，但不使用 `clang -x c++`
基本问题我有以下代码 #include #include using namespace std; int main () { int32_t spam; spam=5; cout
clang - 如何在源文件中禁用 clang 未使用的命令行参数错误
当我在xcode中编译.c文件时，出现错误提示: clang error: argument unused during compilation: '-fno-objc-exceptions' [-W
clang - 是否有只是一个注释的 Clang 诊断？
Clang has several kinds of diagnostics ，其中三种主要是错误、警告和注释。注释通常伴随着某些警告和错误，例如重复定义: error: conflicting t
clang - 从 clang 匹配回调中获取方法调用的参数
我正在调整 Clang 工具模板(如 here 所述)以在我的代码中搜索特定的方法调用。为了稍后重写该调用，我想获取调用该方法的参数的类型，以及调用该方法的对象的类型。我设法找到了一个可以回调以下内
clang - 如何使用 clang 在另一个语句之前检测一个语句
我必须通过在它之前添加一个语句来检测 clang 中的某些语句。我有一个指向 Expr 对象的指针，我需要在包含它的语句之前插入另一个语句。现在我正在使用一种hacky方法，它只是将 SourceLo
clang - Clang AST 节点何时会有多个父节点？
类 clang::ASTContext 有一个方法: DynTypedNodeList getParents(const NodeT &Node) 它返回给定 AST 节点的父节点列表。通常 AST
clang - .clang-tidy 配置文件内容被忽略
我想修改代码分析器程序clang-tidy的检查正在做，但是好像是配置文件.clang-tidy的内容正在被忽视。我通过调用 clang-tidy 创建文件带旗-dump-config并将输出重定向
clang - 使用 clang 为文件创建调用图
有没有办法用clang创建一个可以合理地适合页面的调用图？即给出: #include using namespace std; int main() { int a; cin>>a;
clang - 评估 clang 工具中的常量表达式
我正在编写一个 Clang 工具，并且试图弄清楚如何在访问程序 AST 的情况下评估字符串文字。给定以下程序: class DHolder { public: DHolder(std::strin
clang - Clang TOT 一词指的是什么？
我想在 Clang 中尝试一些新功能，有人提到我 Clang TOT . 现在这可能是一个明显的问题，到底是什么Clang TOT . TOT 一定是一些我不熟悉的首字母缩写词。任何人都可以启发我吗

首页

博学

6Ren·AI

商城

assembly - 为什么 clang 的结尾使用 `add $N, %rsp` 而不是 `mov %rbp, %rsp` 来恢复 `%rsp` ？

更新(额外)