gpt4 book ai didi

c - 使用 sub/cmp/setbe 将 asm 逆向工程返回到 C?我的尝试是编译到分支

转载 作者:太空狗 更新时间:2023-10-29 15:56:33 28 4
gpt4 key购买 nike

这是我应该翻译的汇编代码:f1:

subl    $97, %edi
xorl %eax, %eax
cmpb $25, %dil
setbe %al
ret

这是我编写的我认为等效的 C 代码。

int f1(int y){

int x = y-97;
int i = 0;

if(x<=25){
x = i;
}
return x;
}

下面是我编译 C 代码的结果。

_f1: ## @f1

.cfi_startproc

%bb.0:

pushq   %rbp
.cfi_def_cfa_offset 16
.cfi_offset %rbp, -16
movq %rsp, %rbp
.cfi_def_cfa_register %rbp
## kill: def %edi killed %edi def %rdi
leal -97(%rdi), %ecx
xorl %eax, %eax
cmpl $123, %edi
cmovgel %ecx, %eax
popq %rbp
retq
.cfi_endproc

我想知道这是否正确/应该有什么不同,是否有人可以帮助解释 jmps 是如何工作的,因为我也在尝试翻译此汇编代码并被卡住了f2:

cmpl    $1, %edi
jle .L6
movl $2, %edx
movl $1, %eax
jmp .L5

.L8:

movl    %ecx, %edx

.L5:

imull   %edx, %eax
leal 1(%rdx), %ecx
cmpl %eax, %edi
jg .L8

.L4:

cmpl    %edi, %eax
sete %al
movzbl %al, %eax
ret

.L6:

movl    $1, %eax
jmp .L4

最佳答案

gcc8.3 -O3 使用无符号比较技巧以这种编写范围检查的方式发出问题中的 asm。

int is_ascii_lowercase_v2(int y){
unsigned char x = y-'a';
return x <= (unsigned)('z'-'a');
}

int 之后缩小到 8 位 subtract 更精确地匹配 asm,但它不是正确性所必需的,甚至也不是说服编译器使用 32 位 sub 的必要条件。 .对于 unsigned char y ,RDI 的高位字节允许存放任意垃圾(x86-64 System V 调用约定),但进位仅通过 sub 和 add 从低到高传播。

结果的低 8 位(所有 cmp 读取)与 sub $'a', %dil 相同或 sub $'a', %edi .

将其编写为正常的范围检查也会使 gcc 发出相同的代码,因为编译器知道如何优化范围检查。 (并且 gcc 选择对 sub 使用 32 位操作数大小,这与使用 8 位的 clang 不同。)

int is_ascii_lowercase_v3(char y){
return (y>='a' && y<='z');
}

On the Godbolt compiler explorer ,这个和_v2编译如下:

## gcc8.3 -O3
is_ascii_lowercase_v3: # and _v2 is identical
subl $97, %edi
xorl %eax, %eax
cmpb $25, %dil
setbe %al
ret

以整数形式返回比较结果,而不是使用 if , 更自然地匹配 asm

但即使在 C 中“无分支地”编写它也不会匹配 asm,除非您启用优化。 gcc/clang 的默认代码生成是 -O0 : 反优化以实现一致的调试,在语句之间将所有内容存储/重新加载到内存中。 (以及函数入口上的函数参数。)您需要优化,因为 -O0 code-gen(故意)大部分是脑残,而且看起来很讨厌。参见 How to remove "noise" from GCC/clang assembly output?

## gcc8.3 -O0
is_ascii_lowercase_v2:
pushq %rbp
movq %rsp, %rbp
movl %edi, -20(%rbp)
movl -20(%rbp), %eax
subl $97, %eax
movb %al, -1(%rbp)
cmpb $25, -1(%rbp)
setbe %al
movzbl %al, %eax
popq %rbp
ret

启用优化的 gcc 和 clang 将在有效时将 if 转换为无分支代码。例如

int is_ascii_lowercase_branchy(char y){
unsigned char x = y-'a';
if (x < 25U) {
return 1;
}
return 0;
}

仍然编译成与 GCC8.3 -O3 相同的 asm

is_ascii_lowercase_branchy:
subl $97, %edi
xorl %eax, %eax
cmpb $25, %dil
setbe %al
ret

我们可以看出优化级别至少为 gcc -O2 。在 -O1 , gcc 使用效率较低的 setbe/movzx 而不是在 setbe 之前对 EAX 进行异或归零

is_ascii_lowercase_v2:
subl $97, %edi
cmpb $25, %dil
setbe %al
movzbl %al, %eax
ret

我永远无法让 clang 重现完全相同的指令序列。它喜欢使用 add $-97, %edi , 和 cmp 与 $26/setb .

或者它会像这样做非常有趣(但次优)的事情:

# clang7.0 -O3
is_ascii_lowercase_v2:
addl $159, %edi # 256-97 = 8-bit version of -97
andl $254, %edi # 0xFE; I haven't figured out why it's clearing the low bit as well as the high bits
xorl %eax, %eax
cmpl $26, %edi
setb %al
retq

所以这涉及到 -(x-97) ,也许在某处使用 2 的补码身份 ( -x = ~x + 1 )。

关于c - 使用 sub/cmp/setbe 将 asm 逆向工程返回到 C?我的尝试是编译到分支,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54974851/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com