gpt4 book ai didi

assembly - 为什么静态变量的地址是相对于指令指针的?

转载 作者:太空狗 更新时间:2023-10-29 17:21:12 29 4
gpt4 key购买 nike

我正在关注 this tutorial关于 assembly 。

根据教程(我在本地也试过,也得到了类似的结果),源码如下:

int natural_generator()
{
int a = 1;
static int b = -1;
b += 1; /* (1, 2) */
return a + b;
}

编译为这些汇编指令:

$ gdb static
(gdb) break natural_generator
(gdb) run
(gdb) disassemble
Dump of assembler code for function natural_generator:
push %rbp
mov %rsp,%rbp
movl $0x1,-0x4(%rbp)
mov 0x177(%rip),%eax # (1)
add $0x1,%eax
mov %eax,0x16c(%rip) # (2)
mov -0x4(%rbp),%eax
add 0x163(%rip),%eax # 0x100001018 <natural_generator.b>
pop %rbp
retq
End of assembler dump.

(我添加的行号注释 (1)(2)(1, 2)。)

问题:为什么在编译后的代码中,静态变量b的地址是相对于指令指针(RIP)的,它不断变化(参见 (1)(2) 行),因此生成更复杂的汇编代码,而不是相对于可执行文件的特定部分,其中存储这样的变量?

根据提到的教程,这样的部分:

This is because the value for b is hardcoded in a different section of the sample executable, and it’s loaded into memory along with all the machine code by the operating system’s loader when the process is launched.

(强调我的。)

最佳答案

使用RIP 相对寻址访问静态变量b 的主要原因有两个。首先是它使代码位置独立,这意味着它是否用于共享库或 position independent executable代码可以更容易地重新定位。第二个是它允许将代码加载到 64 位地址空间中的任何位置,而无需在指令中编码巨大的 8 字节(64 位)位移,而 64 位 x86 CPU 无论如何都不支持这种位移。

您提到编译器可以改为生成引用变量的代码,该代码相对于它所在的部分的开头。虽然这样做也具有与上面给出的相同的优点,但它不会使程序集任何不那么复杂。事实上,这会使它变得更复杂。生成的汇编代码首先必须计算变量所在段的地址,因为它只知道它相对于指令指针的位置。然后它必须将它存储在寄存器中,因此可以相对于该地址访问 b(以及该部分中的任何其他变量)。

由于 32 位 x86 代码不支持 RIP 相对寻址,您的替代解决方案实际上是编译器在生成 32 位位置独立代码时所做的。它将变量b放在全局偏移表(GOT)中,然后访问相对于GOT基址的变量。这是使用 gcc -m32 -O3 -fPIC -S test.c 编译时您的代码生成的程序集:

natural_generator:
call __x86.get_pc_thunk.cx
addl $_GLOBAL_OFFSET_TABLE_, %ecx
movl b.1392@GOTOFF(%ecx), %eax
leal 1(%eax), %edx
addl $2, %eax
movl %edx, b.1392@GOTOFF(%ecx)
ret

第一个函数调用将后续指令的地址放在 ECX 中。下一条指令通过添加 GOT 从指令开始的相对偏移量来计算 GOT 的地址。变量 ECX 现在包含 GOT 的地址,并在访问其余代码中的变量 b 时用作基础。

将其与 gcc -m64 -O3 -S test.c 生成的 64 位代码进行比较:

natural_generator:
movl b.1745(%rip), %eax
leal 1(%rax), %edx
addl $2, %eax
movl %edx, b.1745(%rip)
ret

(该代码与您问题中的示例不同,因为启用了优化。一般来说,只查看优化输出是个好主意,因为如果不进行优化,编译器通常会生成糟糕的代码,这些代码会做很多无用的事情。另请注意,不需要使用 -fPIC 标志,因为无论如何编译器都会生成 64 位位置独立代码。)

注意 64 位版本中如何少了两条汇编指令,使其成为不太复杂的版本。您还可以看到代码使用了一个较少的寄存器 (ECX)。虽然它对您的代码没有太大影响,但在一个更复杂的示例中,它是一个可以用于其他用途的寄存器。这使得代码更加复杂,因为编译器需要处理更多的寄存器。

关于assembly - 为什么静态变量的地址是相对于指令指针的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40329260/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com