- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我想了解 C 调用约定。为此,我编写了以下代码:
#include <stdio.h>
#include <stdlib.h>
struct tstStruct
{
void *sp;
int k;
};
void my_func(struct tstStruct*);
typedef struct tstStruct strc;
int main()
{
char a;
a = 'b';
strc* t1 = (strc*) malloc(sizeof(strc));
t1 -> sp = &a;
t1 -> k = 40;
my_func(t1);
return 0;
}
void my_func(strc* s1)
{
void* n = s1 -> sp + 121;
int d = s1 -> k + 323;
}
然后我通过以下命令使用 GCC:
gcc -S test3.c
并想出了它的 assembly 体。我不会展示我得到的全部代码,而是粘贴函数 my_func 的代码。是这样的:
my_func:
.LFB1:
.cfi_startproc
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
movq %rsp, %rbp
.cfi_def_cfa_register 6
movq %rdi, -24(%rbp)
movq -24(%rbp), %rax
movq (%rax), %rax
addq $121, %rax
movq %rax, -16(%rbp)
movq -24(%rbp), %rax
movl 8(%rax), %eax
addl $323, %eax
movl %eax, -4(%rbp)
popq %rbp
.cfi_def_cfa 7, 8
ret
.cfi_endproc
据我了解,情况是这样的:首先,调用者的基指针被压入堆栈,其堆栈指针成为新的基指针,为新函数设置堆栈。但其余的我不明白。据我所知,参数(或指向参数的指针)存储在堆栈中。如果是这样,第二条指令的目的是什么,
movq -24(%rbp), %rax
在这里,%rax 寄存器的内容被移动到距离寄存器 %rbp 中的地址 24 字节的地址。但是 %rax 中是什么????最初什么都没有存储在那里???我想我很困惑。请帮助了解此功能的工作原理。 提前致谢!
最佳答案
您混淆了 AT&T 语法和 Intel 语法。
movq -24(%rbp), %rax
在 Intel 语法中是
mov rax,[rbp-24]
因此它将由 rbp
寻址的数据移动到 rax
,而不是相反。操作数的顺序在 AT&T 语法中是 src, dest,而在 Intel 语法中是 dest, src。
然后,为了摆脱 GAS 指令以使反汇编更易于阅读,我使用 gcc 简单地使用 gcc test3.c
组装了代码,并使用 ndisasm -b 64 a 对其进行了反汇编.out
。请注意,下面由 NDISASM 生成的 my_func
函数的反汇编采用 Intel 语法:
000005EF 55 push rbp000005F0 4889E5 mov rbp,rsp ; create the stack frame.000005F3 48897DE8 mov [rbp-0x18],rdi ; s1 into a local variable.000005F7 488B45E8 mov rax,[rbp-0x18] ; rax = s1 (it's a pointer)000005FB 488B00 mov rax,[rax] ; dereference rax, store into rax.000005FE 4883C079 add rax,byte +0x79 ; rax = rax + 12100000602 488945F8 mov [rbp-0x8],rax ; void* n = s1 -> sp + 12100000606 488B45E8 mov rax,[rbp-0x18] ; rax = pointer to s10000060A 8B4008 mov eax,[rax+0x8] ; dereference rax+8, store into eax.0000060D 0543010000 add eax,0x143 ; eax = eax + 32300000612 8945F4 mov [rbp-0xc],eax ; int d = s1 -> k + 32300000615 5D pop rbp00000616 C3 ret
有关 Linux x86-64 调用约定 (System V ABI) 的信息,请参阅 What are the calling conventions for UNIX & Linux system calls on x86-64 的答案。 .
关于c - 理解 C 反汇编调用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16088946/
我试图在图形模式下打印一个字符。通常当我打印我正在做的一个字符时: mov ah,14 ; ah=14 mov al,'x' int 10h ; print the character 这
我试图通过更改其中的一个字节来修改存储在内存中的字符串。我为此使用了 movb,但由于某种原因,给定内存位置的字节没有改变。 在 gdb 调试器上: 14 movb %al, (%r10) # nex
我一直在阅读一些汇编代码,并且开始发现调用指令实际上是与程序计数器相关的。 但是,每当我使用 Visual Studio 或 Windbg 进行调试时,它总是显示 call 0xFFFFFF ...这
我最近一直在使用 Visual C++ 中的内联汇编,我想知道是否可以直接向堆栈上的局部变量添加值,例如: push 5 add [esp], 7 这样做可以吗?我问这个问题是因为我在执行此操作时随机
我有下一个代码: mov al, -5 add al, 132 add al, 1 据我检查,溢出标志和进位标志将在第一个操作中设置,而在第二个操作中,仅设置溢出。 但我不明白为什么: 在无符号数中,
在 64 位 x86 汇编 nasm 中,如何将单个字节从寄存器移动到 .data 节中定义的内存位置? 我知道这有效 global _main section .data quotient db 0
我的汇编代码有问题。我想打印存储在寄存器 cx 中的数字,但是当我尝试打印它时,它打印的是 ascii 字符而不是 ascii 数字,所以我决定编写一个程序将 ascii char 转换为 ascii
为什么第 1B 行的跳转指令(例如)变成了 EBBD? 我知道“jmp”= EB但是BD是怎么计算的呢? 最佳答案 短跳转使用一个带符号的偏移量添加到 JMP 之后的指令地址。 例如,第一个 JMP
以下两者有什么区别: mov eax, [eax+4] 和 add eax, 4 mov eax, [eax] 如果不是,那么汇编器是否会选择哪个来进行某种优化? 最佳答案 这
看《The Shellcoder's Handbook》中的一些汇编和反汇编代码,发现一条指令的序列操作数是不一样的。 例如,在 assembly 上: mov ebx,0 并且,在反汇编时: mov
我有这个非常简单的汇编代码: start: add ax, 100 ; if ax overflow add to bx 1 jmp start 但我不知道如何检测 ax 寄存器溢出,有人可以帮
在 64 位 x86 汇编 nasm 中,如何将单个字节从寄存器移动到 .data 节中定义的内存位置? 我知道这有效 global _main section .data quotient db 0
我的汇编代码有问题。我想打印存储在寄存器 cx 中的数字,但是当我尝试打印它时,它打印的是 ascii 字符而不是 ascii 数字,所以我决定编写一个程序将 ascii char 转换为 ascii
我正在学习一些关于操作系统开发的教程,我发现了一篇关于多重引导 header 。这些是您必须定义的一些“神奇”值才能使用GRUB2。这些是命令: # Declare constants used f
为什么第 1B 行的跳转指令(例如)变成了 EBBD? 我知道“jmp”= EB但是BD是怎么计算的呢? 最佳答案 短跳转使用一个带符号的偏移量添加到 JMP 之后的指令地址。 例如,第一个 JMP
我正在尝试从内存中复制一些单词并使用汇编将其保存到另一个内存地址。我正在尝试为其编写代码,但我不确定其中的某些部分。我将简要描述我想要做什么。 源地址、目标地址和要复制的字数是函数的输入参数。 最佳答
当我们想要像这样创建一个初始化变量时: name db 'zara ali' 我们创建了一个字节大小变量,但我们在其中存储了一个字符串 这怎么可能?? 当我们使用这条指令时: MOV ecx, nam
我还是汇编的新手,我还不知道汇编中的许多命令代码。我想在 16 位寄存器中进行除法。我想打印它的内容。我知道我需要将寄存器的内容转换为 ASCII 进行打印,但同样,我的问题是除法。请帮我。 比如cx
使用有什么区别: c.eq.s $1, $2 bc1t L2 并使用: beq $1, $2, L2 如果他们做同样的事情,为什么有两种分支方式?如果它们不同,那么它们各自的好处是什么
源代码: int main() { int i; for(i=0, i : push rbp 2. 0x000055555555463b :
我是一名优秀的程序员,十分优秀!