gpt4 book ai didi

linux - 为什么这个程序的 32 位和 64 位编译版本以这种方式填充内存?

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:21:28 25 4
gpt4 key购买 nike

我正在尝试更好地理解堆栈和堆的工作原理。在比较同一程序的 32 位和 64 位编译版本时,我遇到了麻烦。在这两种情况下,我都使用了 guest Fedora 15 VM(32 位和 64 位),gcc 用于编译,gdb 用于调试,以及相同的主机硬件。有问题的程序非常简单,紧接在下面:

C程序

void function(int a, int b, int c, int d){
int value;
char buffer[10];

value = 1234;
buffer[0] = 'A';
}

int main(){
function(1, 2, 3, 4);
}

为了节省空间,我省略了程序的汇编转储;但是,如果有人认为它可以帮助他们回答我的问题,我很乐意将其包括在内。

32 位编译程序:

参数4(0xbffff3e4)、3(0xbffff3e0)、2(0xbffff3dc)和1(0xbffff3d8)先入栈。接下来指令的位置跟随函数() 的调用——或返回地址——被放置在堆栈上(0x080483d1)。接下来,前一个堆栈的基指针值 (0xbffff3e8) 被压入堆栈。

(gdb) x/16xw $esp
0xbffff3c0: 0x00000000 0x410759c3 0x4105d237 0x00000000
0xbffff3d0: 0xbffff3e8 0x080483d1 0x00000001 0x00000002//pointers
0xbffff3e0: 0x00000003 0x00000004 0x00000000 0x4105d413//followed by params
0xbffff3f0: 0x00000001 0xbffff484 0xbffff48c 0x41040fc4

64 位编译程序:

但是;这里找不到值 4、3、2 和 1。我所能看到的,无论我看到的堆栈有多远,都是返回地址 (0x4004ae) 和前一个堆栈帧的基指针 (0x7fffffffe210)。

(gdb) x/16xg $rsp
0x7fffffffe200: 0x00007fffffffe210 0x00000000004004ae //pointers
0x7fffffffe210: 0x0000000000000000 0x00000036d042139d
0x7fffffffe220: 0x0000000000000000 0x00007fffffffe2f8
0x7fffffffe230: 0x0000000100000000 0x0000000000400491
0x7fffffffe240: 0x0000000000000000 0x7ade47f577d82f75
0x7fffffffe250: 0x0000000000400390 0x00007fffffffe2f0
0x7fffffffe260: 0x0000000000000000 0x0000000000000000
0x7fffffffe270: 0x8521b80ab3982f75 0x7ab3e77151682f75

带有 print 语句的 64 位编译程序:

现在,在添加一个简单的打印语句之后:

printf("%d, %c\n", flag, buffer[0]);

在 function() 中,我可以看到任性的参数(见下文,0x7fffffffe1e0-0x7fffffffe1ec)。我还可以从之前的堆栈帧中看到基指针,0x7fffffffe210(在 0x7fffffffe200 中)和返回地址 0x400520(在 0x7fffffffe208 中)。我相信它由于新的打印声明而改变了。 在这种情况下,如果没有打印语句,为什么 4、3、2 和 1 不可见? gcc 编译器的 64 位实现是否足够智能,不会为从未使用过的参数和局部变量“浪费”内存?

(gdb) x/16xg $rsp
0x7fffffffe1e0: 0x0000000300000004 0x0000000100000002 //parameters
0x7fffffffe1f0: 0x0000000000000000 0x00000000004003e0
0x7fffffffe200: 0x00007fffffffe210 0x0000000000400520 //pointers
0x7fffffffe210: 0x0000000000000000 0x00000036d042139d
0x7fffffffe220: 0x0000000000000000 0x00007fffffffe2f8
0x7fffffffe230: 0x0000000100000000 0x0000000000400503
0x7fffffffe240: 0x0000000000000000 0xd3c0c92559feaed9
0x7fffffffe250: 0x00000000004003e0 0x00007fffffffe2f0

最后,为什么 32 位操作系统将参数 4、3、2 和 1 放置在堆栈中比前面提到的指针更高。为什么 64 位操作系统将参数放在堆栈中低于的指针?我的印象是传递的参数总是首先放在堆栈中(因此,会位于较大值的内存地址中,因为堆栈向较小的地址增长)。然后是保存的基指针和返回地址(因此可以将基指针重置为其先前的值并且可以返回调用函数)。这是我在 32 位编译代码中观察到的行为,但不是 64 位版本。我误会了什么?我感谢对此事的任何见解,如果我的问题不清楚,我深表歉意。请让我知道我可以更简洁的任何方式(或者如果我在任何时候实际上是不正确的)。

提前谢谢你。

最佳答案

64-bit ABI used by Linux与 32 位 ABI 有很大不同:在 64 位世界中,参数通常在寄存器中传递,而不是在堆栈中传递。

在添加 printf() 之前,您没有在堆栈中找到参数,因为前(最多)6 个整数或指针参数在寄存器中传递(按顺序 %rdi, %rsi, %rdx, %rcx, %r8, %r9).

在添加 printf() 之后,它们可能会在寄存器内容为 printf() 调用打乱的过程中保存在堆栈中 - 看一下在大会上;一旦您知道 ABI 是什么样子,这可能就很明显了。

关于linux - 为什么这个程序的 32 位和 64 位编译版本以这种方式填充内存?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6686929/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com