- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试学习汇编在基本级别上的工作方式,因此我一直在玩gcc编译的-S输出。我编写了一个简单的程序,该程序定义了两个字节并返回它们的和。整个程序如下:
int main(void) {
char A = 5;
char B = 10;
return A + B;
}
gcc -O0 -S -c test.c
.file "test.c"
.def ___main; .scl 2; .type 32; .endef
.text
.globl _main
.def _main; .scl 2; .type 32; .endef
_main:
LFB0:
.cfi_startproc
pushl %ebp
.cfi_def_cfa_offset 8
.cfi_offset 5, -8
movl %esp, %ebp
.cfi_def_cfa_register 5
andl $-16, %esp
subl $16, %esp
call ___main
movb $5, 15(%esp)
movb $10, 14(%esp)
movsbl 15(%esp), %edx
movsbl 14(%esp), %eax
addl %edx, %eax
leave
.cfi_restore 5
.cfi_def_cfa 4, 4
ret
.cfi_endproc
LFE0:
.ident "GCC: (GNU) 4.9.2"
.global _main
_main:
movl $15, %eax
ret
.file "test.c"
.def ___main; .scl 2; .type 32; .endef
.section .text.unlikely,"x"
LCOLDB0:
.section .text.startup,"x"
LHOTB0:
.p2align 4,,15
.globl _main
.def _main; .scl 2; .type 32; .endef
_main:
LFB0:
.cfi_startproc
pushl %ebp
.cfi_def_cfa_offset 8
.cfi_offset 5, -8
movl %esp, %ebp
.cfi_def_cfa_register 5
andl $-16, %esp
call ___main
movl $15, %eax
leave
.cfi_restore 5
.cfi_def_cfa 4, 4
ret
.cfi_endproc
LFE0:
.section .text.unlikely,"x"
LCOLDE0:
.section .text.startup,"x"
LHOTE0:
.ident "GCC: (GNU) 4.9.2"
最佳答案
谢谢Kin3TiX,您提出了一个asm-newbie问题,这不仅仅是一些不带注释的讨厌代码的代码转储,而是一个非常简单的问题。 :)
作为使用ASM的一种方法,我建议使用main
以外的功能。例如只是一个需要两个整数args并将其相加的函数。然后,编译器无法对其进行优化。您仍然可以使用常量作为args来调用它,并且如果它与main
位于不同的文件中,则不会内联,因此甚至可以单步执行它。
理解main
时在asm级别上发生的事情有一些好处,但是除了嵌入式系统之外,您只会在asm中编写优化的内部循环。 IMO,如果您不打算对其进行优化,那么使用asm毫无意义。否则,您可能不会击败更容易阅读的源代码编译器输出。
了解编译器输出的其他技巧:使用
gcc -S -fno-stack-check -fverbose-asm
。每条指令后的注释通常可以很好地提醒您该加载的目的。很快,它就变成了诸如D.2983
这样的临时名称,但类似movq 8(%rdi), %rcx # a_1(D)->elements, a_1(D)->elements
将为您节省ABI参考的往返时间,以查看arg中是否包含%rdi
函数,以及哪个struct成员位于偏移量8处。
从.cfi_startproc到call__main的行甚至做什么?
_main:
LFB0:
.cfi_startproc
pushl %ebp
.cfi_def_cfa_offset 8
.cfi_offset 5, -8
movl %esp, %ebp
.cfi_def_cfa_register 5
.cfi
是调试信息。这是
strip
将从二进制文件中删除的内容,或者,如果您不使用
-g
,这些内容将不会放在第一位。 IDK为什么它们出现在
-S
输出中,而没有
-g
。我经常从
objdump -d
输出而不是
gcc -S
看asm。通常是因为我可以对可执行文件进行基准测试并查看其asm,而无需多次调用
gcc
。
%ebp
然后将其设置为函数条目上的堆栈指针的值的工作将建立所谓的“堆栈框架”。这就是为什么
%ebp
被称为基本指针的原因。如果使用
-fomit-frame-pointer
进行编译,这些insns将不存在,这会为代码提供额外的寄存器以供使用。 (这对于32位x86来说是巨大的,因为这需要6到7个regs。(
%esp
仍被用作堆栈指针;将其临时存储在xmm或mmx reg中,然后可以将其用作另一个GP reg ,但是您的代码将很难调试!)
leave
之前的
ret
指令也是此堆栈框架内容的一部分。
-fomit-frame-pointer
,您也可以回溯调用堆栈,这是amd64的默认设置。 (amd64 ABI对堆栈有对齐要求,在其他方面也比很多更好。例如,在regs中而不是在堆栈中传递args。)
andl $-16, %esp
subl $16, %esp
and
将堆栈对齐到16个字节的边界,而不管它以前是什么。
sub
在此功能的堆栈上保留16个字节。 (请注意,优化版本中缺少它,因为它可以优化对任何变量的内存存储的需求。)
call ___main
_main
(asm name =
__main
)可能是一个gcc运行时库函数,用于为需要它的东西调用构造函数。也许是库设置的东西,可能是在其中调用任何您自己的全局/静态变量的构造函数的地方。 (此
old mailing list message表示
_main
是用于构造函数的,但是它主要不需要在支持让启动代码对其进行调用的平台上调用它。也许i386并不具有该功能,只有amd64吗?)编辑:您在评论中说这来自cygwin。因为cygwin必须制作非ELF .exe,所以可以这样解释。
movb $5, 15(%esp)
movb $10, 14(%esp)
movsbl 15(%esp), %edx
movsbl 14(%esp), %eax
addl %edx, %eax
leave
ret
movb
来自两个变量的初始化器。返回值是通过两次加载来计算的(带有符号扩展名,因为我们需要在加法之前上转换为int,以匹配编写的C代码的语义,直到溢出为止)。
sub
指令。在调用
__main
之前,它在堆栈上为函数的变量保留了空间。您在说哪个其他子?
info gas
。
.ident
和
.def
:看起来像gcc将其戳记放在目标文件上,因此您可以知道是什么编译器/汇编器产生了它。不相关,请忽略这些。
.section
:确定以下所有指令或数据指令(例如
.byte 0x00
)中的字节进入ELF目标文件的哪个部分,直到下一个
.section
汇编程序指令为止。
code
(只读,可共享),
data
(初始化的读/写数据,私有)或
bss
(块存储段。零初始化,不占用目标文件中的任何空间)。
.p2align
:2的幂对齐。用nop指令填充,直到所需的对齐。
.align 16
与
.p2align 4
相同。对齐目标时,跳转指令的速度更快,这是因为以16B的块为单位取指令,不跨越页面边界或仅不跨越高速缓存行边界。 (如果代码已在Intel Sandybridge及更高版本的uop缓存中,则32B对齐才有意义。)例如,请参见
Agner Fog's docs。
main
有很多特别之处。
mov
-即时和
ret
,但是gcc显然没有识别琐碎的整个程序并忽略
main
的堆栈框架或调用的快捷方式到
_main
。 >。<
关于c - GCC assembly 优化-为什么这些等效?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31166773/
我被告知“汇编”是您在文件中编写的内容,让您的“汇编程序”将其转换为二进制代码。 但我看到这两个术语在各种作品中混合搭配。我什至听说你编写了“汇编器”,然后“汇编器”使其可执行。 正确的用词是什么?
我在正确终止用 Assembly 编写的 16 位 DOS 程序时遇到问题。这是部分代码: .386P .model flat stack_s segment stack 'stack'
我需要多少档才能正确执行以下指令。我对我所做的事情有些困惑,所以我在这里看到专家的答案。 lw $1,0($2); beq $1,$2,Label; 请注意,检查是否会发生分支将在解码阶段完成。但是在
我正在尝试在汇编中进行简单的乘法运算,但是由于某些原因,当标记了MUL函数时,我看不到寄存器会发生变化。 mov bx, 5 mov cx, 10 mul cx 最佳答案 这些称为指令,它们指定
我正在尝试在 Assembly 中实现递归斐波那契程序。但是,我的程序崩溃了,出现了未处理的异常,我似乎无法找出问题所在。我不怀疑这涉及我对堆栈的不当使用,但我似乎无法指出哪里...... .386
我编写了以下代码: .386 .model small .stack 100h .data text db "Paper",0 .code start : lea dx ,
我有一个用汇编语言编写的裸机 ARM 的启动代码,我正在尝试了解它是如何工作的。该二进制文件被写入一些外部闪存中,并在启动时将其自身的一部分复制到 RAM 中。尽管我读过这篇文章wikipedia e
我在数据部分定义了一个二维数组和两个一维数组(一个用于列总和,一个用于行总和),并且我编写了一个函数,将二维数组求和到一维数组中。我使用 eax 和 ebx 作为二维数组的索引,但是当 eax 或 e
我正在开始组装,我正在使用 nasm 来组装代码,我正在尝试处理驻留在内存中的字符串并更改它,我想检查一个字节是否在某个范围内(ascii),这样我就可以决定如何处理它,我似乎不知道如何检查一个值是否
虽然您通常不希望将一个整体程序集用于小型项目以外的任何事情,但可能会将事物分离得太多。 组装分离过多的迹象/气味是什么? 最佳答案 第一个(明显的)是:在一个有很多项目的解决方案中,其中只有少数(比如
我正在尝试编写斐波那契的汇编代码版本,它给出第 n 个斐波那契数并返回它。 出于某种原因,它在存储斐波那契数的返回值和添加它们时遇到问题。 我希望它打印第 n 个斐波那契数。 我对我的代码做了一些修改
我有一个最小的、可重现的示例有两个问题,该示例具有三个针对 .NET Core 3.1 的项目。但我也想以 .NET Standard 2.0 为目标。 该示例适用于需要在运行时加载程序集并使用提供的
: 运算符在汇编中做什么?代码如下:DS:DX我还没有找到该运算符(operator)的任何文档。(我正在使用 NASM) 最佳答案 那实际上只是一个寄存器分隔符,而不是运算符。这意味着使用 DX 寄
我在哪里可以找到为 gmp-5.0.0 编写的程序的汇编代码我正在使用 UBUNTU 和 G++ 编译器..编译代码的命令是“g++ test.cc -o outp -lgmp” 实际上我想知道在 1
我是组装新手,我有一个关于如何表示负数的问题 我有三个 DWORDS 变量,比如说: result DWORD 0 i DWORD 3 j DWORD 5 我想计算这个公式:result = i -
我想编写我的第一个汇编程序。我在论文上做了一些程序,但这是我第一次使用编译器。我正在使用 ideone .我的程序很简单, 翻译 A = 5 - A到 assembly NEG A ADD A, 5
程序集,masm 嘿,我写了宏来打印存储在 dane1 段中的 1 字节值。 我将值除以 16,然后将提醒推送到堆栈,直到值==0。然后我弹出提醒将它们转换为 ASCII 码,并打印它们。 有人可以看
我正在研究 nasm 的一个大学项目。唯一的问题是我无法生成 162 和 278 之间的偶数随机数。我尝试了很多算法,但似乎无法限制范围内的数字。 是否有一个小技巧或调整来获得所需的范围内的数字?目的
终于在无数次错误的漫长 session 之后,希望这是最后一个。 没有编译或运行时错误,只是一个逻辑错误。 编辑:(固定伪代码) 我的伪代码: first = 1; second = 1; thir
我知道在程序集r0中调用函数时,包含第一个参数,直到r3是第四个。我知道,当它超过四个时,将使用堆栈指针,但是我不太确定具体细节。 r0-r3仍然保持前四个,其余的进入堆栈吗?我正在看下面的程序集,试
我是一名优秀的程序员,十分优秀!