- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
考虑以下几点:
ammarfaizi2@integral:/tmp$ vi test.c
ammarfaizi2@integral:/tmp$ cat test.c
extern void use_buffer(void *buf);
void a_func(void)
{
char buffer[4096];
use_buffer(buffer);
}
__asm__("emit_mov_rbp_to_rsp:\n\tmovq %rbp, %rsp");
ammarfaizi2@integral:/tmp$ clang -Wall -Wextra -c -O3 -fno-omit-frame-pointer test.c -o test.o
ammarfaizi2@integral:/tmp$ objdump -d test.o
test.o: file format elf64-x86-64
Disassembly of section .text:
0000000000000000 <emit_mov_rbp_to_rsp>:
0: 48 89 ec mov %rbp,%rsp
3: 66 2e 0f 1f 84 00 00 cs nopw 0x0(%rax,%rax,1)
a: 00 00 00
d: 0f 1f 00 nopl (%rax)
0000000000000010 <a_func>:
10: 55 push %rbp
11: 48 89 e5 mov %rsp,%rbp
14: 48 81 ec 00 10 00 00 sub $0x1000,%rsp
1b: 48 8d bd 00 f0 ff ff lea -0x1000(%rbp),%rdi
22: e8 00 00 00 00 call 27 <a_func+0x17>
27: 48 81 c4 00 10 00 00 add $0x1000,%rsp
2e: 5d pop %rbp
2f: c3 ret
ammarfaizi2@integral:/tmp$
在a_func()
的最后,返回之前,是恢复%rsp
的函数结语。它使用 add $0x1000, %rsp
产生 48 81 c4 00 10 00 00
。
它不能只使用只产生 3 个字节的 mov %rbp, %rsp
48 89 ec
吗?
为什么 clang 不使用更短的方式 (mov %rbp, %rsp
)?
在权衡代码大小的情况下,使用 add $0x1000, %rsp
而不是 mov %rbp, %rsp
有什么优势?
即使使用 -Os
,它仍然会产生相同的代码。所以我认为必须有一个合理的理由来避免 mov %rbp, %rsp
。
ammarfaizi2@integral:/tmp$ clang -Wall -Wextra -c -Os -fno-omit-frame-pointer test.c -o test.o
ammarfaizi2@integral:/tmp$ objdump -d test.o
test.o: file format elf64-x86-64
Disassembly of section .text:
0000000000000000 <emit_mov_rbp_to_rsp>:
0: 48 89 ec mov %rbp,%rsp
0000000000000003 <a_func>:
3: 55 push %rbp
4: 48 89 e5 mov %rsp,%rbp
7: 48 81 ec 00 10 00 00 sub $0x1000,%rsp
e: 48 8d bd 00 f0 ff ff lea -0x1000(%rbp),%rdi
15: e8 00 00 00 00 call 1a <a_func+0x17>
1a: 48 81 c4 00 10 00 00 add $0x1000,%rsp
21: 5d pop %rbp
22: c3 ret
ammarfaizi2@integral:/tmp$
最佳答案
如果它完全使用 RBP 作为帧指针,是的,mov %rbp, %rsp
会更紧凑并且 AFAIK 至少在所有 x86 微体系结构上一样快。 (移动消除甚至可能适用于它)。当 add 常量不适合 imm8 时更是如此。
这可能是一个遗漏的优化,非常类似于https://bugs.llvm.org/show_bug.cgi?id=10319 (它建议使用 leave
而不是 mov/pop,这将在 Intel 上额外花费 1 个 uop,但又节省了 3 个字节)。它指出在正常情况下整体静态代码大小的节省非常小,但并未考虑效率优势。在正常构建中(-O2
没有 -fno-omit-frame-pointer
)只有少数函数会使用帧指针(仅当使用 VLA/alloca 时,或者过度对齐堆栈),因此可能的 yield 甚至更小。
从那个错误看来,它只是一个 LLVM 懒得去寻找的窥孔,因为许多函数还需要恢复其他寄存器,所以您实际上需要添加
一些其他值到将 RSP 点在其他推送下方。
(GCC 有时使用 mov
来恢复调用保留的 reg,因此它可以使用 leave
。使用帧指针,这使得寻址模式相当紧凑以进行编码,尽管一个 4 字节的 qword mov -8(%rbp), %r12
当然仍然没有 2 字节的 pop 小。如果我们没有帧指针(例如在 -O2
代码),mov %rbp, %rsp
从来都不是一个选项。)
在考虑“不值得找”的理由之前,我想到了另一个小好处:
调用保存/恢复RBP的函数后,RBP为加载结果。所以在 mov %rbp, %rsp
之后, future 使用 RSP 需要等待加载。可能某些极端情况最终会在存储转发延迟方面成为瓶颈,而寄存器修改仅为 1 个周期。
但总的来说,这似乎不太值得额外的代码大小;我希望这种极端情况很少见。尽管 pop %rbp
需要那个新的 RSP 值,所以调用者恢复的 RBP 值是我们返回后两次加载链的结果。 (幸运的是 ret
有分支预测来隐藏延迟。)
因此,在某些基准测试中可能值得尝试这两种方式;例如在一些标准基准测试(如 SPECint)上将此与调整后的 LLVM 版本进行比较。
关于assembly - 为什么 clang 的结尾使用 `add $N, %rsp` 而不是 `mov %rbp, %rsp` 来恢复 `%rsp` ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69385513/
有什么方法可以恢复删除的元素吗? 这是我删除元素的代码 myFunction() { var width = window.innerWidth; var February = doc
我有一个 TokuDB 表,由于某种原因缺少 ***_status.tokudb 文件。 我还不确定文件是否由于 TokuDB 崩溃而丢失。 问题是: 有没有办法从主要文件和关键文件(我可以从 tok
我正在 Windows 7 (x86) 上运行带有 Workbench 6.3.8 的 32 位 MySQL Server 5.7.22 本地实例(必须选择 32 位版本 - 所以,较旧的版本)。 我
1、备份 <% SQL="backup database 数据库名 to disk='"&Serve
1、ASP中怎么实现SQL数据库备份、恢复! 答:asp在线备份sql server数据库: 1、备份 <% SQL="ba
我在 R 中使用 stats::filter 函数来理解 R 中的 ARIMA 模拟(如在函数 stats::arima.sim 中)和估计。我知道 stats::filter 将线性过滤器应用于向量
我已经浏览了示例应用程序的文档和代码,并发现 files/objectbox/objectbox/data.mdb 是存储所有数据的默认文件。 假设我的理解是正确的,我有几个问题找不到文档: 我想在我
为了恢复非续订订阅类型的 InAppPurchase,我已经实现了服务器来处理此问题。 但在购买过程中,iTunes 有时不会要求用户验证他们的卡详细信息, 在这种情况下,它会在后台发送应用程序并显示
我的问题是寻找cocos2d游戏期间暂停/恢复状态(包括所有需要保存的数据信息)的设计解决方案。 包括但不限于以下情况: 1).用户选择退出,然后弹出一个对话框供用户选择“直接退出”、“暂停”; 2)
在 Mercurial 中,我有一个旧的变更集,除了对单个文件的更改外,它都很好。我将如何恢复对该单个文件的更改? 即使只是能够在上一个变更集中查看文件的状态也会很好,然后我可以剪切和粘贴。 我的 M
我的一项职能遇到了困难。我想做的是计时器在页面加载后立即启动,并且只有一个带有启动/恢复的按钮。我无法在代码中找出需要更改功能的位置。有人可以帮助我吗?谢谢! HTML: , Javascr
我正在阅读Scrap your type classes 。这为类型类提供了替代方案。然而,我被Paul Chiusano的评论所困扰。其中讨论了恢复 do 表示法 语法。 坦白说,我无法理解 ret
当 OrientDB 因某人重新启动机器而非正常关闭时,OrientDB 最终会处于数据恢复失败的状态。对于如何从这种不正常的关闭中正常恢复有什么建议吗?我们正在寻找系统在断电期间能够自行恢复的方法。
我正在构建一个 Electron 应用程序,如果发生崩溃,它必须重新加载渲染进程窗口。 目前我可以从主进程重新启动应用程序 app.relaunch(); app.quit(); 但我无法检测到窗口崩
我有 3 个 Activity ,比如说 MainActivity、 Activity 2 和 Activity 3。 在 MainActivity 中,我有一个按钮(开始/停止),当我单击此按钮时,
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 11 年前。 Improve thi
Twilio 是否支持暂停和恢复内容播放。换句话说,我有相当长的文件将播放给调用者,并且我正在尝试找到一种方法来实现暂停和恢复功能。在播放某些内容的过程中,我希望用户能够按数字暂停,然后再次按数字从音
我已经提交了 A、B、C、D 和 E。我意识到在提交 B 中发生了一些非常糟糕的事情,所以我想回到 A,这次正确地进行之前搞砸了 B 的更改,然后重新应用 C 、 D 和 E 自动。 您可能想知道为什
我的一个文件被“标记为文本”,图标也发生了变化。实际上这是一个 PHP 文件。我尝试过使用 Help -> Find Action -> Mark As 尝试将其恢复为 PHP 突出显示,但它不起作用
我有一些 SSE 程序,可以将循环中的内存归零,当指针未对齐时,它会引发 SIGSEGV进入我的处理程序。我可以在此类处理程序中获取更多信息吗例行公事,现在我不知道它是在哪里完成的,我也可以吗以某种可
我是一名优秀的程序员,十分优秀!