assembly - call *(%rax, %rcx,8) 在循环中是什么意思？为什么RAX和RCX之后要变？-6ren

assembly - call *(%rax, %rcx,8) 在循环中是什么意思？为什么RAX和RCX之后要变？

转载作者：行者123 更新时间：2023-12-02 17:59:35

24

4

我有这个函数指针和这段代码:

0x0000555555556e80 <+0>:     push   %rbp
0x0000555555556e81 <+1>:     mov    %rsp,%rbp
0x0000555555556e84 <+4>:     sub    $0x10,%rsp
0x0000555555556e88 <+8>:     movl   $0x0,-0x4(%rbp)
0x0000555555556e8f <+15>:    movslq -0x4(%rbp),%rcx
0x0000555555556e93 <+19>:    lea    0x7406(%rip),%rax        # 0x55555555e2a0 <init_functions>
0x0000555555556e9a <+26>:    cmpq   $0x0,(%rax,%rcx,8)
0x0000555555556e9f <+31>:    je     0x555555556ec1 <initialize_bomb+65>
0x0000555555556ea5 <+37>:    movslq -0x4(%rbp),%rcx
0x0000555555556ea9 <+41>:    lea    0x73f0(%rip),%rax        # 0x55555555e2a0 <init_functions>
0x0000555555556eb0 <+48>:    call   *(%rax,%rcx,8)
0x0000555555556eb3 <+51>:    mov    -0x4(%rbp),%eax
0x0000555555556eb6 <+54>:    add    $0x1,%eax
0x0000555555556eb9 <+57>:    mov    %eax,-0x4(%rbp)
0x0000555555556ebc <+60>:    jmp    0x555555556e8f <initialize_bomb+15>
0x0000555555556ec1 <+65>:    add    $0x10,%rsp
0x0000555555556ec5 <+69>:    pop    %rbp
0x0000555555556ec6 <+70>:    ret

就是一个迭代11次的循环，真不知道怎么处理函数指针。当有 call *(%rax,%rcx,8) 时，涉及的两个寄存器(RAX 和 RCX)发生变化，但我不明白如何或为什么，因为我不知道会发生什么在那个电话中...

我不能设置断点。我不知道该怎么办。

最佳答案

call *address 使用标准 AT&T 语法将函数指针从内存加载到 RIP 中，用于在 * 之后的寻址模式(或寄存器名称)。参见 What does an asterisk * before an address mean in x86-64 AT&T assembly? 所以这会推送一个返回地址，然后从地址 [rax + rcx*8] 加载一个新的 RIP。

call *foo 语法(EIP/RIP = dword/qword loaded from memory at foo, memory-indirect)有一个星号来消除与call的歧义foo(RIP = foo 的地址，直接调用 rel32)，以防您仅使用裸符号名称作为寻址模式。

在 64 位模式下，您通常会对不在数组中的静态函数指针使用 call *foo(%rip)，但 AT&T 语法的设计早在 x86-64 之前存在，并且 64 位模式仍然存在这种歧义。 (在所有其他情况下，如果您遗漏 *，GAS 会发出警告，并且如果您编写类似 call (%rax) 的内容，则推断您的意思是间接跳转/调用或 调用 %rax。)

RAX 和 RCX 被调用破坏，因此它们不保持其值是正常的；请注意它们在 call 之前的值如何来自 LEA 和来自堆栈上本地的加载。 ( What registers are preserved through a linux x86-64 function call )

如果您想查看调用了哪些函数，请使用 GDB stepi(又名 si)单步执行调用。 (在此函数的某处放置一个断点，以便您可以从那里单步执行。)

如果您想了解循环，请查看围绕调用 的代码。

相对于 RIP 的 LEA 将一个常量地址放入 RAX；正如 fjs 指出的那样，有一个符号名称 init_functions。

RCX 从堆栈上的局部变量加载，符号扩展从 32 位到 64 位。看看周围的代码，这显然是一个循环计数器，在函数的前面初始化为零。大概是一个 int。

在调用之前，进行相同的数组索引以检查它是否为 NULL 指针。这显然是debug-mode compiler output ，其中每个 C 语句都被编译为一个单独的 asm block 。这意味着您只需要在本地查看一个 block 在孤立地做什么，但它会导致比必要的代码多得多，例如两次访问数组，每次都重做循环计数器的符号扩展。

像这样的事情很简单，整个循环很容易在优化的构建中遵循。嗯，很简单； GCC 确实旋转循环，因此条件可以在底部，部分剥离它。并在保存 RBX(收缩包装优化)之前检查第一个条件，它用于将指针保存到数组中。 (而不是使用指针和单独的整数索引)。

extern void (*init_functions[])();

void init(){
    for(int i=0 ; init_functions[i]  ; i++) 
        init_functions[i]();
}

Godbolt

init():
        movq    init_functions(%rip), %rax   # partially peeled first iteration
        testq   %rax, %rax
        je      .L9
        pushq   %rbx
        leaq    8+init_functions(%rip), %rbx      # fptr = &init_functions[1]
          # enter the loop with RAX holding first array entry
.L3:                         # do{
        call    *%rax
        movq    (%rbx), %rax    # load the next 
        addq    $8, %rbx        # fptr++
        testq   %rax, %rax      # and test it
        jne     .L3          # }while( *fptr != 0 )
        popq    %rbx
        ret
.L9:
        ret         # silly compiler, no need for tail duplication here.

关于assembly - call *(%rax, %rcx,8) 在循环中是什么意思？为什么RAX和RCX之后要变？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/74762663/

24

4

0

文章推荐： matlab - 如何在 Matlab 中从有序 double 组中删除元素子集

文章推荐： javascript - setInterval 对象方法仅运行一次

文章推荐： javascript - 如何获取这样的图像的src？

文章推荐： common-lisp - 将字符串转换为函数

gcc - mov %rax,%rax 的目的是什么？
我目前正在通过反汇编一些 C 代码来学习 ASM。我感兴趣的一件事是 gcc 编译器生成这样的代码 movq %rax,%rax 这显然毫无意义。那么这样做的目的是什么？我想知道是不是用来浪费几个C
assembly - 是 mov rax,0x12345678; jmp rax 仍然会杀死分支预测吗？
我无法找到上述两种情况的具体信息，尽管听取了您的专家意见。第一件事是:我知道间接 jmp 会损害分支预测，并且即使间接结果恒定，它仍然需要预测维护缓冲区和其他内容，所有这些都与绝对 jmp 相比。
visual-studio - x64汇编指令“nop dword ptr [rax + rax]”有什么作用？
我试图了解由编译器完成的x64程序集优化。我在Windows 8.1上使用Release IDE将Visual Studio 2008 SP1构建为一个小型C ++项目。其中一行包含以下汇编代码：
assembly - "mov (%rax),%eax"和 "mov %rax,%eax"有什么区别？
mov (%rax),%eax有什么区别和 mov %rax,%eax ?我确定这是一个简单的问题，但我在任何地方都找不到答案。这是提示我的问题的原始代码: mov -0x8(%rbp),%r
c++ - 为什么 VS 做 imul rax,rax,0 而不是简单的移动？
我正在查看为这个简单的 x64 程序生成的程序集 Visual Studio: struct Point { int a, b; Point() { a = 0; b
c - gcc 输出反汇编中的 data32 data32 nopw %cs :0x0(%rax, %rax,1) 指令的含义是什么？
在为 gcc 编译器的 -O2 优化运行一些测试时，我在函数的反汇编代码中观察到以下指令: data32 data32 data32 data32 nopw %cs:0x0(%rax,%rax,1)
assembly - RAX 寄存器的名称是什么？
这个问题已经有答案了: What does the R stand for in RAX, RBX, RCX, RDX, RSI, RDI, RBP, RSP? [duplicate] (2 个回答)
assembly - 为什么要将他已经拥有的相同值复制到 rax 中？
有人可以向我解释一下为什么我们将主函数@0x6f5中的rax中的值移至rdi，然后将值复制到rdi 到 get_v 的堆栈，然后将其移回 rax @0x6c8?。也许这是x86-64的约定，但我不明白
c++ - 调用但不跳转到 rax 中的地址时出现段错误
我正在使用类似汇编程序的 API(它不是真正的汇编程序，但它可以发出机器代码)，我正在调试和玩弄它。它专门用于 System V x86_64 ABI，因此我将只讨论 SysV 调用约定等。出于某种
c - 函数调用是否与 %rax 以外的其他寄存器混淆？
这个问题在这里已经有了答案: What registers are preserved through a linux x86-64 function call (3 个答案) 关闭 4 年前。这
c++ - 为什么这个函数将 RAX 插入堆栈作为第一个操作？
在下面的 C++ 源程序集中。为什么将 RAX 插入堆栈？ RAX，据我所知，ABI 可以包含来自调用函数的任何内容。但是我们将它保存在这里，然后将堆栈向后移动 8 个字节。所以堆栈上的 RAX 是，
assembly - 使用相同的小正数有效加载 RAX 和 R8
我可以写 mov rax, 1(7 字节编码 48, C7, C0, 01, 00, 00, 00)，而不是写 mov eax, 1 (5字节编码B8,01,00,00,00)依赖自动高位双字归零。
assembly - 'callq *(%rax)' 是什么意思？
我正在 gdb session 中分析事后崩溃。我正在查看函数的反汇编输出，我看到了: => 0x00007f8d354aed52 : callq *(%rax) => 表示这是崩溃时调用的指
assembly - 从 64 位地址加载到其他寄存器而不是 rax
在 x64 上，从 64 位绝对地址加载(即取消引用 64 位立即数)可以通过 movabs addr64, %rax 但是，当目标寄存器不是 rax 时汇编程序给出了一条错误消息，说 operand
assembly - "rax"与 "eax"有什么不同？
这个问题已经有答案了: What do the E and R prefixes stand for in the names of Intel 32-bit and 64-bit registers
assembly - 如何在汇编中将 RAX 中的值写入 STDOUT？
我可以使用 syscall for write 将内存中的一些数据打印到 STDOUT: ssize_t write(int fd, const void *buf, size_t count); 即
无法理解简单程序集 x86 中 %rax 的值
#include #include typedef struct item { int low; int high; char label[16]; } Item; typedef str
c - 为什么我要添加 rax 和 rdx？
这是一个将字符串作为输入传递的程序。我对下面显示的汇编代码感到困惑，特别是第 6 行。这是我从研究中了解到的: rbp-48 是一个指针，指向存放argv 的栈地址。 (argv本身，是指向argv
linux - Fork 系统调用失败后 rax 的返回值是多少？
我知道在 C 中调用 fork() 如果有错误会返回 -1，但我想知道当你调用 sys_fork 时错误返回值是什么> 在组装中。我可能通常假设它也返回 -1 但我已经处理过 sys_brk 并且汇
assembly - 将 EAX 复制到 RAX 更高位？
我想知道是否有任何指令序列而不使用任何其他寄存器来将 RAX 的低 32 位复制到其高 32 位。当然，我也希望 EAX 完好无损。最好也不使用任何堆栈内存。最佳答案我的尝试...在演示派对上进

首页

博学

6Ren·AI

商城

assembly - call *(%rax, %rcx,8) 在循环中是什么意思？为什么RAX和RCX之后要变？