- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
在为 gcc 编译器的 -O2 优化运行一些测试时,我在函数的反汇编代码中观察到以下指令:
data32 data32 data32 data32 nopw %cs:0x0(%rax,%rax,1)
这条指令是做什么的?
更详细地说,我试图了解编译器如何使用 O2 优化来优化无用的递归,如下所示:
int foo(void)
{
return foo();
}
int main (void)
{
return foo();
}
上述代码在未经优化编译时会导致堆栈溢出,但适用于 O2 优化代码。
我认为 O2 完全消除了函数 foo 的压栈,但为什么需要 data32 data32 data32 data32 nopw %cs:0x0(%rax,%rax,1)
?
0000000000400480 <foo>:
foo():
400480: eb fe jmp 400480 <foo>
400482: 66 66 66 66 66 2e 0f data32 data32 data32 data32 nopw %cs:0x0(%rax,%rax,1)
400489: 1f 84 00 00 00 00 00
0000000000400490 <main>:
main():
400490: eb fe jmp 400490 <main>
最佳答案
你看到一个 operand forwarding优化 cpu 流水线。
虽然这是一个空循环,但 gcc 也会尝试对其进行优化:-)。
您正在运行的 cpu 有一个 superscalar建筑学。这意味着,它有一个管道,并且连续指令执行的不同阶段并行发生。例如,如果有一个
mov eax, ebx ;(#1)
mov ecx, edx ;(#2)
然后指令#2 的加载和解码可以在执行#1 时发生。
流水线在分支的情况下有主要问题需要解决,即使它们是无条件的。
例如,当 jmp
正在解码时,下一条指令已经预取到流水线中。但是 jmp
改变了下一条指令的位置。在这种情况下,管道需要清空和重新填充,大量有值(value)的 cpu 周期将丢失。
在这种情况下,如果管道中充满空操作,看起来这个空循环会运行得更快,尽管它永远不会被执行。它实际上是对 x86 管道的一些不常见特性的优化。
较早的 dec alpha 甚至可以从这些事情中产生段错误,空循环中必须有很多空操作。 x86 只会更慢。这是因为它们必须与 intel 8086 兼容。
Here您可以从流水线中分支指令的处理中读到很多内容。
关于c - gcc 输出反汇编中的 data32 data32 nopw %cs :0x0(%rax, %rax,1) 指令的含义是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29871947/
我目前正在通过反汇编一些 C 代码来学习 ASM。我感兴趣的一件事是 gcc 编译器生成这样的代码 movq %rax,%rax 这显然毫无意义。那么这样做的目的是什么? 我想知道是不是用来浪费几个C
我无法找到上述两种情况的具体信息,尽管听取了您的专家意见。 第一件事是:我知道间接 jmp 会损害分支预测,并且即使间接结果恒定,它仍然需要预测维护缓冲区和其他内容,所有这些都与绝对 jmp 相比。
我试图了解由编译器完成的x64程序集优化。 我在Windows 8.1上使用Release IDE将Visual Studio 2008 SP1构建为一个小型C ++项目。 其中一行包含以下汇编代码:
mov (%rax),%eax有什么区别和 mov %rax,%eax ?我确定这是一个简单的问题,但我在任何地方都找不到答案。 这是提示我的问题的原始代码: mov -0x8(%rbp),%r
我正在查看为这个简单的 x64 程序生成的程序集 Visual Studio: struct Point { int a, b; Point() { a = 0; b
在为 gcc 编译器的 -O2 优化运行一些测试时,我在函数的反汇编代码中观察到以下指令: data32 data32 data32 data32 nopw %cs:0x0(%rax,%rax,1)
这个问题已经有答案了: What does the R stand for in RAX, RBX, RCX, RDX, RSI, RDI, RBP, RSP? [duplicate] (2 个回答)
有人可以向我解释一下为什么我们将主函数@0x6f5中的rax中的值移至rdi,然后将值复制到rdi 到 get_v 的堆栈,然后将其移回 rax @0x6c8?。也许这是x86-64的约定,但我不明白
我正在使用类似汇编程序的 API(它不是真正的汇编程序,但它可以发出机器代码),我正在调试和玩弄它。它专门用于 System V x86_64 ABI,因此我将只讨论 SysV 调用约定等。 出于某种
这个问题在这里已经有了答案: What registers are preserved through a linux x86-64 function call (3 个答案) 关闭 4 年前。 这
在下面的 C++ 源程序集中。为什么将 RAX 插入堆栈? RAX,据我所知,ABI 可以包含来自调用函数的任何内容。但是我们将它保存在这里,然后将堆栈向后移动 8 个字节。所以堆栈上的 RAX 是,
我可以写 mov rax, 1(7 字节编码 48, C7, C0, 01, 00, 00, 00),而不是写 mov eax, 1 (5字节编码B8,01,00,00,00)依赖自动高位双字归零。
我正在 gdb session 中分析事后崩溃。我正在查看函数的反汇编输出,我看到了: => 0x00007f8d354aed52 : callq *(%rax) => 表示这是崩溃时调用的指
在 x64 上,从 64 位绝对地址加载(即取消引用 64 位立即数)可以通过 movabs addr64, %rax 但是,当目标寄存器不是 rax 时汇编程序给出了一条错误消息,说 operand
这个问题已经有答案了: What do the E and R prefixes stand for in the names of Intel 32-bit and 64-bit registers
我可以使用 syscall for write 将内存中的一些数据打印到 STDOUT: ssize_t write(int fd, const void *buf, size_t count); 即
#include #include typedef struct item { int low; int high; char label[16]; } Item; typedef str
这是一个将字符串作为输入传递的程序。 我对下面显示的汇编代码感到困惑,特别是第 6 行。这是我从研究中了解到的: rbp-48 是一个指针,指向存放argv 的栈地址。 (argv本身,是指向argv
我知道在 C 中调用 fork() 如果有错误会返回 -1,但我想知道当你调用 sys_fork 时错误返回值是什么> 在组装中。 我可能通常假设它也返回 -1 但我已经处理过 sys_brk 并且汇
我想知道是否有任何指令序列而不使用任何其他寄存器来将 RAX 的低 32 位复制到其高 32 位。当然,我也希望 EAX 完好无损。 最好也不使用任何堆栈内存。 最佳答案 我的尝试...在演示派对上进
我是一名优秀的程序员,十分优秀!