gpt4 book ai didi

linux - 在i386和x86-64上UNIX和Linux系统调用的调用约定是什么

转载 作者:行者123 更新时间:2023-11-30 16:49:42 31 4
gpt4 key购买 nike

以下链接说明了用于UNIX(BSD风格)和Linux的x86-32系统调用约定:


http://www.int80h.org/bsdasm/#system-calls
http://www.freebsd.org/doc/en/books/developers-handbook/x86-system-calls.html


但是,UNIX和Linux上的x86-64系统调用约定是什么?

最佳答案

有关以下任何主题的进一步阅读:The Definitive Guide to Linux System Calls



我在Linux上使用GNU汇编器(气体)验证了这些。

 内核接口

x86-32又名i386 Linux系统调用约定:

在x86-32中,使用寄存器传递用于Linux系统调用的参数。 %eax表示syscall_number。 %ebx,%ecx,%edx,%esi,%edi,%ebp用于将6个参数传递给系统调用。

返回值在%eax中。所有其他寄存器(包括EFLAGS)在int $0x80中保留。

我从Linux Assembly Tutorial中摘录了以下片段,但对此感到怀疑。如果有人可以举一个例子,那就太好了。


  如果参数超过六个,
  %ebx必须包含内存
  参数列表的位置
  已存储-但不用担心
  因为您不太可能会使用
  超过六个的系统调用
  论点。


有关示例和更多阅读内容,请参考http://www.int80h.org/bsdasm/#alternate-calling-convention。使用int 0x80的i386 Linux的Hello World的另一个示例:What parts of this HelloWorld assembly code are essential if I were to write the program in assembly?

有一种进行32位系统调用的更快方法:使用sysenter。内核将内存页面映射到每个进程(vDSO)中,而sysenter舞曲的用户空间侧则必须与内核合作才能找到返回地址。寄存器映射的Arg与int $0x80相同。通常,您应该调用vDSO,而不是直接使用sysenter。 (有关链接和调用vDSO的信息,有关sysenter的更多信息以及与系统调用有关的所有其他信息,请参见The Definitive Guide to Linux System Calls。)

x86-32 [Free | Open | Net | DragonFly] BSD UNIX系统调用约定:

参数在堆栈上传递。将参数(最后一个参数先被压入)推入堆栈。然后推送一个额外的32位伪数据(它实际上不是伪数据。有关更多信息,请参见下面的链接),然后给出系统调用指令int $0x80

http://www.int80h.org/bsdasm/#default-calling-convention



x86-64 Linux系统调用约定:

x86-64 Mac OS X is similar but different。 TODO:检查* BSD的功能。

请参阅System V Application Binary Interface AMD64 Architecture Processor Supplement的“ A.2 AMD64 Linux内核约定”部分。可以在linked from this page in the ABI maintainer's repo中找到i386和x86-64 System V psABI的最新版本。 (有关最新的ABI链接和有关x86 asm的许多其他好东西,请参见标签Wiki。)

这是本节的片段:


  
  用户级应用程序用作整数寄存器,用于传递
  序列%rdi,%rsi,%rdx,%rcx,
  %r8和%r9。内核接口使用%rdi,%rsi,%rdx,%r10,%r8和%r9。
  通过syscall指令进行系统调用。此clobbers %rcx and %r11以及%rax返回值,但保留了其他寄存器。
  系统调用的编号必须在寄存器%rax中传递。
  系统调用限制为六个参数,不传递任何参数
  直接在堆栈上。
  从系统调用返回,寄存器%rax包含以下结果:
  系统调用。值介于-4095和-1之间表示
  错误,它是-errno
  仅将类INTEGER或类MEMORY的值传递到内核。
  


请记住,这是从ABI特定于Linux的附录中获得的,即使对于Linux来说,它的信息内容也不是规范的。 (但实际上是准确的。)

此32位int $0x80 ABI可用于64位代码(但强烈建议不要使用)。 What happens if you use the 32-bit int 0x80 Linux ABI in 64-bit code?它仍然将其输入截断为32位,因此不适合使用指针,并且将r8-r11设置为零。

 用户界面:函数调用

x86-32函数调用约定:

在x86-32中,参数在堆栈上传递。最后一个参数首先被压入堆栈,直到所有参数都完成,然后执行call指令。这用于从程序集在Linux上调用C库(libc)函数。

现代版本的i386 System V ABI(在Linux上使用)要求在%esp之前将call与16字节对齐,就像x86-64 System V ABI一直需要的一样。被调用者被允许假设并使用SSE 16字节加载/存储在未对齐时发生故障。但是从历史上看,Linux只需要4字节堆栈对齐,因此即使为8字节double之类的东西保留自然对齐的空间也要花费额外的工作。

其他一些现代的32位系统仍然不需要超过4字节的堆栈对齐。



x86-64 System V用户空间函数调用约定:

x86-64 System V在寄存器中传递了args,这比i386 System V的堆栈args约定效率更高。它避免了将args存储到内存(高速缓存)然后再将它们重新加载到被调用方中的延迟和额外的指令。这很好,因为有更多可用的寄存器,并且对于延迟和乱序执行至关重要的现代高性能CPU更好。 (i386 ABI很旧)。

在这种新机制中:首先,将参数划分为类。每个参数的类决定了将其传递给被调用函数的方式。

有关完整的信息,请参考:System V Application Binary Interface AMD64 Architecture Processor Supplement的“ 3.2函数调用序列”,部分读取:


  对参数进行分类后,便会分配寄存器(在
  从左到右的顺序),如下所示:
  
  
  如果该类是MEMORY,则在堆栈上传递参数。
  如果该类是INTEGER,则该类的下一个可用寄存器
  使用了序列%rdi,%rsi,%rdx,%rcx,%r8和%r9
  


因此%rdi, %rsi, %rdx, %rcx, %r8 and %r9是用于将整数/指针(即INTEGER类)参数传递给汇编中任何libc函数的寄存器。 %rdi用于第一个INTEGER参数。 %rsi代表第二,%rdx代表第三,依此类推。然后应给出call指令。执行%rsp时,堆栈(call)必须对齐16B。

如果有6个以上INTEGER参数,则将第7个INTEGER参数及更高版本传递给堆栈。 (弹出呼叫者,与x86-32相同。)

前8个浮点args在%xmm0-7中传递,随后在堆栈中传递。没有保留呼叫的向量寄存器。 (一个包含FP和整数参数的函数的寄存器总数可以超过8个。)

可变参数函数(like printf)始终需要%al = FP寄存器args的数量。

对于何时将结构打包到寄存器(返回时为rdx:rax)与在内存中打包有一些规则。有关详细信息,请参见ABI,并检查编译器输出,以确保您的代码与编译器就如何传递/返回某些内容达成一致。



请注意,the Windows x64 function calling convention与x86-64 System V有多个显着差异,例如必须由调用方保留的阴影空间(而不是红色区域)和保留呼叫的xmm6-xmm15。 arg进入哪个寄存器的规则也非常不同。

关于linux - 在i386和x86-64上UNIX和Linux系统调用的调用约定是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42492062/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com