- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我理解 push rbp
...pop rbp
在函数开始和结束时的用法,以保留 rbp
的值调用函数,因为 rbp
寄存器是被调用者保留的。然后我理解了使用 rbp
作为当前正在执行的过程的堆栈帧的当前顶部的“约定”。但与此相关,我有两个问题:
rbp
只是一个约定吗?我是否可以像使用 r11
(或任何其他寄存器甚至堆栈上的 8 个字节)一样轻松地用作堆栈帧的基础? rbp
寄存器有什么特别之处,还是只是根据历史和惯例用作堆栈框架?mov %rbp, %rsp
在离开函数之前用作“清理”方法?例如,push/pop
指令通常是对称的,因此 mov %rbp, %rsp
只是一种简写方式,人们可以“跳过”执行对称弹出操作/添加等等? where mov %rbp, %rsp
的实际用法是什么?几乎每次我在编译器输出中看到它(启用零优化)时,它似乎都是不必要的或多余的,而且我很难想到它可能真正有用的场景。最佳答案
优化后的代码根本不使用帧指针,除了像 VLAs/alloca
(RSP 的可变大小移动)这样的东西,或者如果你专门使用 -fno-omit- frame-pointer
(例如,使 perf record
堆栈采样更高效/可靠)。未优化的代码通常看起来不那么有趣。 How to remove "noise" from GCC/clang assembly output?
所以关于何时/为什么使用帧指针的部分有很多重复项。有趣的部分是是否可以选择 RBP 以外的寄存器。
RBP 唯一特别之处 是 leave
可以紧凑地做 RSP=RBP + pop RBP;还有一个 (%rbp)
addressing mode requires an explicit disp8
or disp32
(值为 0)。
所以如果您要使用帧指针,您应该选择 RBP,因为它至少与任何其他 reg 作为帧指针一样好,但比其他差用于某些其他用途的 regs。您永远不需要 0(frame_pointer)
,只需要其他偏移量。 (R13 具有相同的 always-needs-a-disp8=0 效果,但随后每个堆栈访问总是需要一个 REX 前缀,例如 add -12(%r13), %eax
不t 与 RBP。)
此外,所有其他“遗留”寄存器(您可以在没有 REX 的情况下使用,即不是 R8-R15)在 at least one instruction that compilers may actually generate 中至少有一个隐式使用,例如 cmpxchg16b
、cpuid
、shl %cl、%reg
、rep movsb
或其他任何内容,所以任何其他 reg作为帧指针会更糟。如果您需要改组以释放 RBX 用于某些需要它用于不同目的的指令,则您不能进行简单的天真未优化(或玩具编译器)代码生成。 (如果您的 .cfi_*
指令指定了异常,则堆栈展开也可能依赖于帧指针始终在特定寄存器中。)
与以前的 x86 模式的一致性是使用 RBP 的充分理由,可以让弱小的人的大脑更容易记住,但如果您要使用 RBP,仍然有代码大小和其他选择 RBP 的原因。 (实际上,由于 (%rsp)
寻址模式总是需要一个 SIB 字节,因此设置帧指针的指令实际上可以在代码大小方面为大型函数付出代价,尽管不是指令/微指令。)
仍然不相关的原因:
RBP 基地址表示 SS 段,如 RSP,它在 16 位模式下相关,理论上在 32 位模式下(非平坦内存模型是可能的),但在 64 位模式下则不相关,它只影响您从非规范地址获得的异常。所以这部分原因基本上消失了,几乎没有人关心 #GP
与 #SS
的区别。
enter
太慢而无法使用,但是如果 RSP 还没有指向保存的 RBP,leave
仍然值得使用,只需要额外花费 1 uop 与在 Intel CPU 上手动 mov %rbp, %rsp
/pop %rbp
,这就是 GCC 所做的。您声称看到了无用的 mov %rbp, %rsp
指令,但这并不是编译器实际执行的操作。
注意mov %rbp, %rsp
(3字节)小于add $imm8, %rsp
(4字节),因此,如果您使用的是帧指针,并且 RSP 未指向已保存的 RBP,那么您不妨以这种方式恢复它。 (除非您需要恢复其他寄存器,如果您将它们保存在 RBP 的正下方而不是在 sub $imm, %rsp
之后,尽管您可以使用 mov
加载来恢复流行音乐。)
关于pointers - 为什么 RBP 而不是另一个寄存器作为帧指针?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66846276/
我刚接触 C 语言几周,所以对它还很陌生。 我见过这样的事情 * (variable-name) = -* (variable-name) 在讲义中,但它到底会做什么?它会否定所指向的值吗? 最佳答案
我有一个指向内存地址的void 指针。然后,我做 int 指针 = void 指针 float 指针 = void 指针 然后,取消引用它们以获取值。 { int x = 25; vo
我正在与计算机控制的泵进行一些串行端口通信,我用来通信的 createfile 函数需要将 com 端口名称解析为 wchar_t 指针。 我也在使用 QT 创建一个表单并获取 com 端口名称作为
#include "stdio.h" #include "malloc.h" int main() { char*x=(char*)malloc(1024); *(x+2)=3; --
#include #include main() { int an_int; void *void_pointer = &an_int; double *double_ptr = void
对于每个时间步长,我都有一个二维矩阵 a[ix][iz],ix 从 0 到 nx-1 和 iz 从 0 到 nz-1。 为了组装所有时间步长的矩阵,我定义了一个长度为 nx*nz*nt 的 3D 指针
我有一个函数,它接受一个指向 char ** 的指针并用字符串填充它(我猜是一个字符串数组)。 *list_of_strings* 在函数内部分配内存。 char * *list_of_strings
我试图了解当涉及到字符和字符串时,内存分配是如何工作的。 我知道声明的数组的名称就像指向数组第一个元素的指针,但该数组将驻留在内存的堆栈中。 另一方面,当我们想要使用内存堆时,我们使用 malloc,
我有一个 C 语言的 .DLL 文件。该 DLL 中所有函数所需的主要结构具有以下形式。 typedef struct { char *snsAccessID; char *
我得到了以下数组: let arr = [ { children: [ { children: [], current: tru
#include int main(void) { int i; int *ptr = (int *) malloc(5 * sizeof(int)); for (i=0;
我正在编写一个程序,它接受一个三位数整数并将其分成两个整数。 224 将变为 220 和 4。 114 将变为 110 和 4。 基本上,您可以使用模数来完成。我写了我认为应该工作的东西,编译器一直说
好吧,我对 C++ 很陌生,我确定这个问题已经在某个地方得到了回答,而且也很简单,但我似乎找不到答案.... 我有一个自定义数组类,我将其用作练习来尝试了解其工作原理,其定义如下: 标题: class
1) this 指针与其他指针有何不同?据我了解,指针指向堆中的内存。如果有指向它们的指针,这是否意味着对象总是在堆中构造? 2)我们可以在 move 构造函数或 move 赋值中窃取this指针吗?
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: C : pointer to struct in the struct definition 在我的初学者类
我有两个指向指针的结构指针 typedef struct Square { ... ... }Square; Square **s1; //Representing 2D array of say,
变量在内存中是如何定位的?我有这个代码 int w=1; int x=1; int y=1; int z=1; int main(int argc, char** argv) { printf
#include #include main() { char *q[]={"black","white","red"}; printf("%s",*q+3); getch()
我在“C”类中有以下函数 class C { template void Func1(int x); template void Func2(int x); }; template void
我在64位linux下使用c++,编译器(g++)也是64位的。当我打印某个变量的地址时,例如一个整数,它应该打印一个 64 位整数,但实际上它打印了一个 48 位整数。 int i; cout <<
我是一名优秀的程序员,十分优秀!