gpt4 book ai didi

c - GCC inline - 推送地址,而不是堆栈的值

转载 作者:行者123 更新时间:2023-12-01 12:40:06 24 4
gpt4 key购买 nike

我正在试验 GCC 的内联汇编程序(我使用 MinGW,我的操作系统是 Win7)。现在我只能使用一些基本的 C stdlib 函数。我通常熟悉 Intel 语法,但对 AT&T 不熟悉。

下面的代码效果很好:

char localmsg[] = "my local message";
asm("leal %0, %%eax" : "=m" (localmsg));
asm("push %eax");
asm("call %0" : : "m" (puts));
asm("add $4,%esp");

但是,LEA 似乎是多余的,因为我可以直接将值压入堆栈。好吧,由于我认为是 AT&T 的特性,这样做:

asm("push %0" : "=m" (localmsg));

将在最终的可执行文件中生成如下汇编代码:

PUSH DWORD PTR SS:[ESP+1F]

因此,不是将地址插入我的字符串,而是将其内容插入,因为用 C 术语来说,“指针”被“取消引用”。这显然会导致崩溃。

我相信这只是 GAS 的正常行为,但我找不到任何关于如何克服这个问题的信息。如果有任何帮助,我将不胜感激。

附言我知道对于那些在这方面有经验的人来说,这是一个微不足道的问题。我预计会被否决,但我只花了 45 分钟寻找解决方案但一无所获。

附言我意识到正确的方法是在 C 代码中调用 puts( )。这纯粹是出于教育/实验原因。

最佳答案

虽然内联 asm 总是有点棘手,但从中调用函数尤其具有挑战性。对于“了解内联 asm”项目,我不建议这样做。如果您还没有,我建议您查看最新的内联汇编 docs .已经做了很多工作来尝试解释内联汇编的工作原理。

也就是说,这里有一些想法:

1) 像这样使用多个 asm 语句不是一个好主意。作为docs说:不要期望一系列 asm 语句在编译后保持完美连续。如果某些指令需要在输出中保持连续,请将它们放在单个多指令 asm 语句中。

2) 直接修改寄存器(就像你用 eax 做的那样)而不让 gcc 知道你这样做也是一个坏主意。您应该使用寄存器约束(这样 gcc 可以选择自己的寄存器)或 clobbers 让 gcc 知道您正在践踏它们。

3) 调用函数(如 puts)时,虽然某些寄存器必须在返回前恢复其值,但某些寄存器可被被调用函数视为临时寄存器(即在返回前修改且未恢复)。正如我在#2 中提到的,让您的 asm 修改寄存器而不通知 gcc 是一个非常糟糕的主意。如果您知道所调用函数的 ABI,则可以将其临时寄存器添加到 asm 的破坏列表中。

4) 虽然在这个特定示例中您使用的是常量字符串,但作为一般规则,当将 asm 指针传递给字符串、结构、数组等时,您可能需要“内存”破坏器以确保任何未决的在开始执行您的 asm 之前执行对内存的写入。

5) 实际上,lea 正在做一些非常重要的事情。 esp 的值在编译时未知,因此您无法执行 push $12345。有人需要计算 (esp + localmsg 的偏移量) 才能将其压入堆栈。另请参阅下面的第二个示例。

6) 如果您更喜欢 intel 格式(哪个思维正常的人不喜欢?),您可以使用 -masm=intel。

考虑到这一切,我对这段代码的第一次剪辑看起来像这样。请注意,这不会破坏 puts 的临时寄存器。剩下的作为练习...

#include <stdio.h>

int main()
{
const char localmsg[] = "my local message";

int result;

/* Use 'volatile' since 'result' is usually not going to get used,
which might tempt gcc to discard this asm statement as unneeded. */

asm volatile ("push %[msg] \n\t" /* Push the address of the string. */
"call %[puts] \n \t" /* Call the print function. */
"add $4,%%esp" /* Clean up the stack. */

: "=a" (result) /* The result code from puts. */
: [puts] "m" (puts), [msg] "r" (localmsg)
: "memory", "esp");

printf("%d\n", result);
}

没错,这并不能避免由于#5 导致的 lea。然而,如果那真的很重要,试试这个:

#include <stdio.h>
const char localmsg[] = "my local message";

int main()
{

int result;

/* Use 'volatile' since 'result' is usually not going to get used. */

asm volatile ("push %[msg] \n\t" /* Push the address of the string. */
"call %[puts] \n \t" /* Call the print function. */
"add $4,%%esp" /* Clean up the stack. */

: "=a" (result) /* The result code. */
: [puts] "m" (puts), [msg] "i" (localmsg)
: "memory", "esp");

printf("%d\n", result);
}

作为一个全局变量,localmsg 的地址现在在编译时是可知的(好吧,我简化了一点),生成的 asm 看起来像这样:

push $__ZL8localmsg
call _puts
add $4,%esp

多田。

关于c - GCC inline - 推送地址,而不是堆栈的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25692381/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com