gpt4 book ai didi

assembly - OR 指令汇编到 ECX 寄存器中

转载 作者:行者123 更新时间:2023-12-03 06:39:34 27 4
gpt4 key购买 nike

在我正在读的一本书中,我们得到了以下片段和问题:

This function uses a combination SCAS and STOS to do its work. First, explain what is the type of the [EBP+8] and [EBP+C] in line 1 and 8, respectively. Next, explain what this snippet does:

01: 8B 7D 08    mov edi, [ebp+8]
02: 8B D7 mov edx, edi
03: 33 C0 xor eax, eax
04: 83 C9 FF or ecx, 0FFFFFFFFh
05: F2 AE repne scasb
06: 83 C1 02 add ecx, 2
07: F7 D9 neg ecx
08: 8A 45 0C mov al, [ebp+0Ch]
09: 8B AA mov edi, edx
10: F3 AA rep stosb
11: 8B C2 mov eax, edx

在检查了在线解决方案(https://johannesbader.ch/2014/05/practical-reverse-engineering-exercises-page-11/)后,我几乎弄清楚了一切,但是,这个片段中的一步对我来说仍然没有意义。

根据网上的解决方案,当我们在第4行运行命令或ecx, 0FFFFFFFFh时,它说

We [now] interpret ECX as a signed integer -1

为了知道 or 命令的结果是什么,我们是否不需要事先知道 ECX 的值是多少?为什么值为-1?

谢谢

最佳答案

32 位 two's complement representation-10xFFFFFFFF (全一)。 1 OR x总是1 ,所以这无条件设置 ecx至-1。这个技巧只适用于 -1,因为 OR 只能设置位,而不能将它们清除为零。

<小时/>

您引用的解决方案中有关将“ecx解释为有符号整数-1”的部分仅在以下 gdb 命令的上下文中才有意义:(gdb) p/d $ecx -> $7 = -1

<强> rep前缀将 ecx 视为无符号计数器。将 ecx 设置为 -1/UINT_MAX 意味着 repne scasb 仅当在内存中找到零时才会停止,而不是因为 ecx一路倒数。 (理论上,如果没有零,它会倒计时并以这种方式结束,但实际上它会首先出现段错误。 -1 不是 rep 的特例)。

<小时/>

为什么使用or :代码大小

将寄存器设置为 anything other than zero 的“正常”方法具有 5 个字节 mov r32, imm32 insn ,例如B9 FF FF FF FF mov ecx,-1 .

如果您更关心代码大小而不是速度,或者您知道对 ecx 的错误依赖这里不是问题,您可以使用符号扩展的 8 位立即数来保存两个字节: or r/m32, imm8 .

83 C9 FF    or ecx, 0FFFFFFFFh

结果中的任何位实际上都不依赖于 ecx 的旧值,因为。然而,真正的CPU不会对此进行特殊处理,因此乱序执行直到 ecx 才能开始。准备好了。这是对 ecx 旧值的错误依赖mov打破了对前一个值的依赖。 (有关此内容的更多信息,请参阅 标签 wiki,尤其是 Agner Fog's guides )。

or ecx, imm8需要 ModRM 字节将目标编码为 ecx,与 mov 的形式不同其中每个目标寄存器都有一个单独的操作码。不幸的是,没有 mov r/m32, imm8 的操作码,这将在许多指令中节省 2 个字节的代码。

如果英特尔愿意放弃 backwards compatibility with undocumented instructions ,他们本来可以添加它。 (8086 没有它,因为在将立即数移动到内存时它只会帮助 16 位代码。他们已经将 8 个操作码专用于 mov r16, imm16 ,这是 16 位模式下的 3 个字节,不需要操作数大小前缀,就像不存在的 mov r/m16, imm8 一样。)

<小时/>

所以在优化代码大小时这是一个有用的习惯用法,例如对于引导加载程序,或 https://codegolf.stackexchange.com/ 上的机器代码答案。 (是的,这是一件事。)

另一个相关技巧是使用 3 字节 lea创建一个常量,如果您在另一个寄存器中已经有另一个常量。例如对于 x86-64 Adler32, I needed two zeroed registers and a 1 ,所以我用了

401120:       31 c0          xor  eax,eax
401122: 99 cdq # zero rdx by sign-extending eax (0) into edx
401123: 8d 7a 01 lea edi,[rdx+0x1] # edi=0+1, using a reg + disp8 addressing mode

关于assembly - OR 指令汇编到 ECX 寄存器中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38619233/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com