- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我熟悉构建函数序言/结尾的两种基本策略:
sub rsp, n
),执行实际工作,然后将堆栈指针移回(add rsp , n
) 和 ret
。 (如果正文中使用了很多寄存器,这里可能还会有一些插入和弹出。)使用策略 2,您不能在主体内调用函数,除非您将堆栈指针移动到它应该在的位置,这会破坏节省,这就是为什么它通常只用于叶函数。
但我想到还有第三种策略可以使用:
mov rsi, AFTER;跳跃功能; AFTER:
用于调用顺序,在函数中只是 jump rsi
最后。在这个方法中,我们完全忽略了堆栈指针,所以我们没有堆栈空间,但对于一个可能可行的小函数。它还需要自定义调用约定,但如果编译器需要内部函数,则可以这样做。
因为它把 jump
和 jump
配对,所以它不会触及返回堆栈,所以分支预测器不应该被丢弃(尽管最后的间接跳转可能比返回慢),并且 call
不会产生内存写入开销。此外,stackless 函数可以调用其他 stackless 函数(虽然不会太多,因为您最终会用完用于存储返回地址的寄存器,并且存在全局优化问题以确保如果 A 调用 B 然后它们使用不同的返回寄存器) .
我的问题是:为什么编译器不多使用方法 (3)? AFAICT 在查看由 gcc 或 clang 编译的函数时,它永远不会出现。是否有此调用约定不可用的原因?
最佳答案
这是对这两个选项进行基准测试的尝试。
.text
.align 8
subroutine:
inc %rdx
#ifdef REG_CALL
jmp *%rsi
#else
ret
#endif
reps = 1000000
.global main
main:
push %rbp
mov $reps, %ecx
xor %edx, %edx
.align 8
top:
.rept 1000
#ifdef REG_CALL
lea 0f(%rip), %rsi
jmp subroutine
0:
#else
call subroutine
#endif
.endr
dec %ecx
jnz top
lea format(%rip), %rdi
mov %rdx, %rsi
xor %eax, %eax
call printf
xor %eax, %eax
pop %rbp
ret
.data
format: .asciz "%ld calls done\n"
它从不同的返回地址调用子例程 1000 次,重复一百万次。组装时没有传统 call/ret
的选项,使用 -DREG_CALL
作为间接跳转建议。
在 i7-8565U CPU @ 1.80GHz 上,传统方式需要 1.6 秒,REG_CALL
需要大约 3.2 秒。所以你的提议似乎慢了一倍。
正如我在评论中提到的,我怀疑 the indirect branch predictor can't keep track jmp *%rsi
要去的地方。
除了运行时效率低下,Raymond Chen mentions another major disadvantage of this strategy in the comments :
Another problem is register assignment if one stackless function calls another. Not only must they use separate return address registers, their other register usages cannot conflict either. This would be practical only for small functions with few callers, at which point you may as well just inline them.
关于assembly - 无堆栈函数的跳转/跳转编译策略。 (手动使用链接注册而不是调用/返回),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65461332/
出于好奇 - 我知道有 LAMP - Linux、Apache、MySQL 和 PHP。但是还有哪些其他 Web 堆栈替代方案的缩写呢?像 LAMR - Linux、Apache、MySQL Ruby
我有以下代码。 var stackMapIn = []; var stackMapOut = []; var stackBack = []; stackMapOut.push("m1"); $scop
我遇到了导致我的堆栈无法恢复的情况,我别无选择,只能将其删除。使用完全相同的模板,我继续创建了另一个同名的堆栈。 The following resource(s) failed to create:
这是我第一次查看 Node 堆栈,自从我学习使用 Ruby on Rails 进行 Web 开发以来,我对一些基本的东西有点困惑。我了解 Rails 目录是什么样的。 demo/ ..../app .
本文实例讲述了C语言使用深度优先搜索算法解决迷宫问题。分享给大家供大家参考,具体如下: 深度优先搜索 伪代码 (Pseudocode)如下: ?
我正在按照指南 here ,它告诉我: The stack setup will download the compiler if necessary in an isolatedlocation (
同时 trying to debug a different question ,我安装了一个似乎与我安装的其他一些软件包冲突的软件包。 我跑了 $ stack install regex-pcre-
我花了几个小时创建了一个方法,该方法将从堆栈 s1 中获取 null 元素,并将它们放入 s2 中。然后该类应该打印堆栈。方法如下 import net.datastructures.ArraySta
我有一个类Floor,它有一个Stack block ,但我不知道如何初始化它。我曾尝试过这样的: public class Floor { private Stack stack;
我知道这个问题已经问过很多次了,但搜索一个小时后我仍然遇到问题。 我想使用一个 lifo 堆栈,它可以存储最大数量的元素。达到最大数量后,首先删除该元素并将其替换为新元素,这样在第一次弹出时我可以获取
我需要编写一个方法,压缩以执行以下操作; 目标compress方法是从栈s1中移除所有null元素。剩余(非空)元素应按其初始顺序保留在 s1 上。辅助堆栈 s2 应用作s1 中元素的临时存储。在该方
我正在尝试验证以下代码发生的顺序。 function square(n) { return n * n; } setTimeout(function(){ console.log("H
我需要一个字符数组,其中包含基于特定文件夹中文件数量的动态数量的字符数组。我能够通过初始化 char (*FullPathNames)[MAX_FILENAME_AND_PATHNAME_LENGTH
我正在编写一些日志逻辑并想要进行一些缩进。了解是否存在任何函数调用或某个函数是否已完成的最简单方法是查看堆栈/帧的当前地址。让我们假设堆栈颠倒增长。然后,如果 log() 调用中的堆栈地址小于前一次调
所以内存分段在x86-64中被放弃了,但是当我们使用汇编时,我们可以在代码中指定.code和.data段/段,并且还有堆栈指针寄存器。 还有堆栈段、数据段和代码段寄存器。 代码/数据/堆栈的划分是如何
void main() { int x = 5; // stack-allocated Console.WriteLine(x); } 我知道 x 是堆栈分配的。但是关于 x 的堆栈中
这是我关于 SO 的第一个问题。这可能是一个愚蠢的问题,但到目前为止我还没弄明白。 考虑下面的程序 Reader.java: public class Reader { public
java中有没有一种快速的方法来获取嵌套/递归级别? 我正在编写一个函数来创建组及其成员的列表。成员也可以是团体。我们最终可能会得到一组循环的组/成员。 我想在某个任意级别停止。 我知道我可以将变量保
考虑以下代码: struct A{...}; A a[100]; A* pa = new A[100]; delete[] pa; a/pa 元素的销毁顺序是由标准定义的还是实现定义的(对于第二种情况
我在下面有一些代码。此代码是一个基本的压入/弹出堆栈类,我将其创建为模板以允许某人压入/弹出堆栈。我有一个家庭作业,我现在要做的是创建一个具有多个值的堆栈。 所以我希望能够创建一个基本上可以发送三个整
我是一名优秀的程序员,十分优秀!