- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在我正在读的一本书中,我们得到了以下片段和问题:
This function uses a combination SCAS and STOS to do its work. First, explain what is the type of the [EBP+8] and [EBP+C] in line 1 and 8, respectively. Next, explain what this snippet does:
01: 8B 7D 08 mov edi, [ebp+8]
02: 8B D7 mov edx, edi
03: 33 C0 xor eax, eax
04: 83 C9 FF or ecx, 0FFFFFFFFh
05: F2 AE repne scasb
06: 83 C1 02 add ecx, 2
07: F7 D9 neg ecx
08: 8A 45 0C mov al, [ebp+0Ch]
09: 8B AA mov edi, edx
10: F3 AA rep stosb
11: 8B C2 mov eax, edx
在检查了在线解决方案(https://johannesbader.ch/2014/05/practical-reverse-engineering-exercises-page-11/)后,我几乎弄清楚了一切,但是,这个片段中的一步对我来说仍然没有意义。
根据网上的解决方案,当我们在第4行运行命令或ecx, 0FFFFFFFFh
时,它说
We [now] interpret ECX as a signed integer -1
为了知道 or
命令的结果是什么,我们是否不需要事先知道 ECX
的值是多少?为什么值为-1?
谢谢
最佳答案
32 位 two's complement representation的-1
是 0xFFFFFFFF
(全一)。 1 OR x
总是1
,所以这无条件设置 ecx
至-1。这个技巧只适用于 -1,因为 OR 只能设置位,而不能将它们清除为零。
您引用的解决方案中有关将“ecx
解释为有符号整数-1”的部分仅在以下 gdb 命令的上下文中才有意义:(gdb) p/d $ecx
-> $7 = -1
。
<强> rep
前缀将 ecx 视为无符号计数器。将 ecx 设置为 -1/UINT_MAX 意味着 repne scasb
仅当在内存中找到零时才会停止,而不是因为 ecx
一路倒数。 (理论上,如果没有零,它会倒计时并以这种方式结束,但实际上它会首先出现段错误。 -1
不是 rep
的特例)。
or
:代码大小将寄存器设置为 anything other than zero 的“正常”方法具有 5 个字节 mov r32, imm32
insn ,例如B9 FF FF FF FF mov ecx,-1
.
如果您更关心代码大小而不是速度,或者您知道对 ecx
的错误依赖这里不是问题,您可以使用符号扩展的 8 位立即数来保存两个字节: or r/m32, imm8
.
83 C9 FF or ecx, 0FFFFFFFFh
结果中的任何位实际上都不依赖于 ecx 的旧值,因为。然而,真正的CPU不会对此进行特殊处理,因此乱序执行直到 ecx
才能开始。准备好了。这是对 ecx 旧值的错误依赖。 mov
打破了对前一个值的依赖。 (有关此内容的更多信息,请参阅 x86 标签 wiki,尤其是 Agner Fog's guides )。
or ecx, imm8
需要 ModRM 字节将目标编码为 ecx,与 mov
的形式不同其中每个目标寄存器都有一个单独的操作码。不幸的是,没有 mov r/m32, imm8
的操作码,这将在许多指令中节省 2 个字节的代码。
如果英特尔愿意放弃 backwards compatibility with undocumented instructions ,他们本来可以添加它。 (8086 没有它,因为在将立即数移动到内存时它只会帮助 16 位代码。他们已经将 8 个操作码专用于 mov r16, imm16
,这是 16 位模式下的 3 个字节,不需要操作数大小前缀,就像不存在的 mov r/m16, imm8
一样。)
所以在优化代码大小时这是一个有用的习惯用法,例如对于引导加载程序,或 https://codegolf.stackexchange.com/ 上的机器代码答案。 (是的,这是一件事。)
另一个相关技巧是使用 3 字节 lea
创建一个常量,如果您在另一个寄存器中已经有另一个常量。例如对于 x86-64 Adler32, I needed two zeroed registers and a 1
,所以我用了
401120: 31 c0 xor eax,eax
401122: 99 cdq # zero rdx by sign-extending eax (0) into edx
401123: 8d 7a 01 lea edi,[rdx+0x1] # edi=0+1, using a reg + disp8 addressing mode
关于assembly - OR 指令汇编到 ECX 寄存器中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38619233/
我是一名优秀的程序员,十分优秀!