- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在 x86 程序集中,是否可以从堆栈中删除一个值而不存储它?类似 pop word null
的东西?我显然可以使用 add esp,4
,但也许我错过了一个漂亮而干净的 cisc 助记符?
最佳答案
add esp,4
/add rsp,8
是正常/惯用/干净的方式。不需要特殊的方式,因为堆栈并不神奇或特殊(至少在这方面不是);它只是寄存器中的一个指针,其中包含一些隐式使用它的指令。 (对于内核堆栈,中断异步使用它,因此软件无法实现内核红区,即使它想要......)
除此之外,在函数末尾清理整个堆栈帧的神奇 CISC 方法是 leave
= mov esp, ebp
/pop ebp
(或 16 位或 64 位等价物)。不像 enter
,它在现代 CPU 上足够快,可以在实践中使用,但在 Intel CPU 上仍然是 3 uop 指令。 ( http://agner.org/optimize/ )。但是leave
如果您使用 ebp
使用额外的指令制作堆栈帧,则仅在第一时间有效。/rbp
首先。 (通常您不会这样做,除非您需要保留可变数量的堆栈空间,例如在循环中使用 push
来创建数组,或等效于 C99 VLA 或 alloca
。或者对于初学者代码使访问本地更容易,或者在 16 位模式下 SP
不能用于寻址模式。)
清理 stack-args 的神奇 CISC 方法是供被调用者使用 ret imm16
(花费 1 个额外的 uop)来弹出 args,创建一个调用约定,其中被调用者清理堆栈。在 caller-pops 调用约定中,无法使用这种形式的 ret
,但您可以简单地保留堆栈偏移量并使用 mov
为下一个函数调用存储参数而不是 push
(如果函数根本需要任何堆栈参数;寄存器参数调用约定通常更有效。)
所以神奇的 CISC 方式在现代 CPU 上没有性能优势,只有很小的代码大小。
您可能会使用以下两个原因 pop reg
而不是 add esp,4
:
pop r32/r64
是一个 1 字节的指令,而 add esp,4
是 3 个字节或 add rsp,8
的 4 个字节. esp
时,英特尔的堆栈引擎必须插入额外的堆栈同步 uops/rsp
在堆栈指令(push/pop/call/ret)之后显式。所以在 call
之后(返回 ret
),它节省了一个 uop 来使用 pop
而不是 add esp,4
在你之前ret
在函数的最后。mov
加载/存储,需要一个单独的 uop 来修改堆栈指针。并在堆栈指针上创建数据依赖项。 add
如果您不需要
pop
的数据会加载。或者,如果您需要将其调整为 +128 字节,请使用
sub esp, -128
, 因为
-128
可编码为符号扩展 imm8,但 +128 不是。
lea esp, [esp+4]
,就像 gcc 对
-mtune=atom
所做的那样. (对于有序原子,而不是silvermont)。就像我说的,如果你想要干净,你不应该选择 x86 asm。
pop
的死寄存器。进入 .如果你需要在弹出一些你真正想要弹出的寄存器之前将 E/RSP 调整一个堆栈槽,你总是可以弹出相同的寄存器两次。
pop
目的地,此优化不可用,您应该简单地使用传统的 add
. 不值得花费额外的说明来实现
pop
;这将超过使用
pop
的次要好处.
pop Sreg
(段寄存器)仍然消耗常规的“堆栈宽度”(32 位或 64 位,取决于模式),而不是 16 位寄存器仅消耗 16 位。
But only pop ds/es/ss
are single-byte. pop fs/gs
are 2 bytes each .因此,如果您正在优化代码大小,
pop gs
比
add esp,4
小 1 个字节,但要慢得多。 (或比
add rsp,8
小 2 个字节)。
关于assembly - x86 程序集 : Pop a value without storing it,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48705427/
我被告知“汇编”是您在文件中编写的内容,让您的“汇编程序”将其转换为二进制代码。 但我看到这两个术语在各种作品中混合搭配。我什至听说你编写了“汇编器”,然后“汇编器”使其可执行。 正确的用词是什么?
我在正确终止用 Assembly 编写的 16 位 DOS 程序时遇到问题。这是部分代码: .386P .model flat stack_s segment stack 'stack'
我需要多少档才能正确执行以下指令。我对我所做的事情有些困惑,所以我在这里看到专家的答案。 lw $1,0($2); beq $1,$2,Label; 请注意,检查是否会发生分支将在解码阶段完成。但是在
我正在尝试在汇编中进行简单的乘法运算,但是由于某些原因,当标记了MUL函数时,我看不到寄存器会发生变化。 mov bx, 5 mov cx, 10 mul cx 最佳答案 这些称为指令,它们指定
我正在尝试在 Assembly 中实现递归斐波那契程序。但是,我的程序崩溃了,出现了未处理的异常,我似乎无法找出问题所在。我不怀疑这涉及我对堆栈的不当使用,但我似乎无法指出哪里...... .386
我编写了以下代码: .386 .model small .stack 100h .data text db "Paper",0 .code start : lea dx ,
我有一个用汇编语言编写的裸机 ARM 的启动代码,我正在尝试了解它是如何工作的。该二进制文件被写入一些外部闪存中,并在启动时将其自身的一部分复制到 RAM 中。尽管我读过这篇文章wikipedia e
我在数据部分定义了一个二维数组和两个一维数组(一个用于列总和,一个用于行总和),并且我编写了一个函数,将二维数组求和到一维数组中。我使用 eax 和 ebx 作为二维数组的索引,但是当 eax 或 e
我正在开始组装,我正在使用 nasm 来组装代码,我正在尝试处理驻留在内存中的字符串并更改它,我想检查一个字节是否在某个范围内(ascii),这样我就可以决定如何处理它,我似乎不知道如何检查一个值是否
虽然您通常不希望将一个整体程序集用于小型项目以外的任何事情,但可能会将事物分离得太多。 组装分离过多的迹象/气味是什么? 最佳答案 第一个(明显的)是:在一个有很多项目的解决方案中,其中只有少数(比如
我正在尝试编写斐波那契的汇编代码版本,它给出第 n 个斐波那契数并返回它。 出于某种原因,它在存储斐波那契数的返回值和添加它们时遇到问题。 我希望它打印第 n 个斐波那契数。 我对我的代码做了一些修改
我有一个最小的、可重现的示例有两个问题,该示例具有三个针对 .NET Core 3.1 的项目。但我也想以 .NET Standard 2.0 为目标。 该示例适用于需要在运行时加载程序集并使用提供的
: 运算符在汇编中做什么?代码如下:DS:DX我还没有找到该运算符(operator)的任何文档。(我正在使用 NASM) 最佳答案 那实际上只是一个寄存器分隔符,而不是运算符。这意味着使用 DX 寄
我在哪里可以找到为 gmp-5.0.0 编写的程序的汇编代码我正在使用 UBUNTU 和 G++ 编译器..编译代码的命令是“g++ test.cc -o outp -lgmp” 实际上我想知道在 1
我是组装新手,我有一个关于如何表示负数的问题 我有三个 DWORDS 变量,比如说: result DWORD 0 i DWORD 3 j DWORD 5 我想计算这个公式:result = i -
我想编写我的第一个汇编程序。我在论文上做了一些程序,但这是我第一次使用编译器。我正在使用 ideone .我的程序很简单, 翻译 A = 5 - A到 assembly NEG A ADD A, 5
程序集,masm 嘿,我写了宏来打印存储在 dane1 段中的 1 字节值。 我将值除以 16,然后将提醒推送到堆栈,直到值==0。然后我弹出提醒将它们转换为 ASCII 码,并打印它们。 有人可以看
我正在研究 nasm 的一个大学项目。唯一的问题是我无法生成 162 和 278 之间的偶数随机数。我尝试了很多算法,但似乎无法限制范围内的数字。 是否有一个小技巧或调整来获得所需的范围内的数字?目的
终于在无数次错误的漫长 session 之后,希望这是最后一个。 没有编译或运行时错误,只是一个逻辑错误。 编辑:(固定伪代码) 我的伪代码: first = 1; second = 1; thir
我知道在程序集r0中调用函数时,包含第一个参数,直到r3是第四个。我知道,当它超过四个时,将使用堆栈指针,但是我不太确定具体细节。 r0-r3仍然保持前四个,其余的进入堆栈吗?我正在看下面的程序集,试
我是一名优秀的程序员,十分优秀!