gpt4 book ai didi

assembly - 如何将字符串的第一个字符与 x86-64 汇编中的另一个字符进行比较?

转载 作者:行者123 更新时间:2023-12-02 03:22:35 25 4
gpt4 key购买 nike

我有一个初始化字符串“Hello, World!”我想从中提取第一个字符(即“H”)并将其转换为在运行时传递到寄存器的字符。

我尝试比较“Hello, World!”的第一个字符通过以下代码使用“H”:

global start

section .data
msg: db "Hello, World!", 10, 0

section .text
start:
mov rdx, msg
mov rdi, [rdx]
mov rsi, 'H'
cmp rdi, rsi
je equal

mov rax, 0x2000001
mov rdi, [rdx]
syscall

equal:
mov rax, 0x2000001
mov rdi, 58
syscall

但是,此代码终止时不会跳转到 equal 标签。而且,我的程序的退出状态是72,这是H的ASCII码。这让我尝试将 72 传递到 rsi 而不是 H,但这也导致程序终止而没有跳转到 等于标签。

如何正确比较“Hello, World!”中的第一个字符带有传递到寄存器的字符?

最佳答案

您和@Rafael 的答案使您的代码过于复杂。

您通常不想将 mov rdi, msg 与绝对地址的 64 位立即数一起使用。 (参见Mach-O 64-bit format does not support 32-bit absolute addresses. NASM Accessing Array)

使用default rel并使用cmp byte [msg], 'H'。或者,如果您希望 RDI 中的指针以便可以在循环中递增它,请使用 lea rdi, [rel msg]。

分支之间唯一不同的是 RDI 值。您不需要重复 RAX 设置或系统调用,只需在 RDI 中获取正确的值,然后让分支重新相互连接即可。 (或者无分支地进行。)

@Rafael 的答案出于某种原因仍然从字符串中加载 8 个字节,就像您问题中的两个加载一样。大概这是 sys_exit ,它忽略高字节,只从低字节设置进程退出状态,但只是为了好玩,让我们假设我们实际上希望为系统调用加载所有 8 个字节,而只比较低字节.

default rel         ; use RIP-relative addressing modes by default for [label]
global start

section .rodata ;; read-only data usually belongs in .rodata
msg: db "Hello, World!", 10, 0

section .text
start:
mov rdi, [msg] ; 8 byte load from a RIP-relative address
mov ecx, 'H'

cmp dil, cl ; compare the low byte of RDI (dil) with the low byte of RCX (cl)
jne .notequal
;; fall through on equal
mov edi, 58
.notequal: ; .labels are local labels in NASM

; mov rdi, [rdx] ; still loaded from before; we didn't destroy it.
mov eax, 0x2000001
syscall

尽可能避免写入 AH/BH/CH/DH。它要么对 RAX/RBX/RCX/RDX 的旧值有错误的依赖,要么如果您稍后读取完整寄存器,可能会导致部分寄存器合并停止。 @Rafael 的答案并没有这样做,但是 mov ah, 'H' 取决于某些 CPU 上 AL 的负载。请参阅 Why doesn't GCC use partial registers?How exactly do partial registers on Haswell/Skylake perform? Writing AL seems to have a false dependency on RAX, and AH is inconsistent - mov ah, 'H' 对 Haswell/Skylake 上 AH 的旧值有错误的依赖,即使 AH 与 RAX 分开重命名。但 AL 不是,所以是的,这很可能对负载有错误的依赖,阻止它并行运行并延迟 cmp 一个周期。

无论如何,这里的 TL:DR 是,如果不需要的话,你不应该乱写 AH/BH/CH/DH。读取它们通常没问题,但延迟可能会更糟。请注意,cmp dil​​, ah 不可编码,因为 DIL 只能通过 REX 前缀访问,而 AH 只能在没有 REX 前缀的情况下访问。

我选择了 RCX 而不是 RSI,因为 CL 不需要 REX 前缀,但由于我们需要查看 RDI (dil) 的低字节,所以我们在 cmp 上无论如何都需要 REX 前缀。我可以使用 mov cl, 'H' 来节省代码大小,因为对 RCX 旧值的错误依赖可能没有问题。


顺便说一句,cmp dil​​, 'H'cmp dil​​, cl 一样有效。

或者,如果我们将零扩展的字节加载到完整的 RDI 中,我们可以使用 cmp edi, 'H' 而不是它的低 8 版本。 (零扩展加载是在现代 x86-64 上处理字节和 16 位整数的正常/推荐方法。合并到旧寄存器值的低字节通常会降低性能,这会导致性能下降。这就是 Why do x86-64 instructions on 32-bit registers zero the upper part of the full 64-bit register? 的原因。)

我们可以用 CMOV 代替分支。对于代码大小和性能而言,这有时更好,有时则不然。

版本 2,仅实际加载 1 个字节:

start:
movzx edi, byte [msg] ; 1 byte load, zero extended to 4 (and implicitly to 8)

mov eax, 58 ; ASCII ':'
cmp edi, 'H'
cmove edi, eax ; edi = (edi == 'H') ? 58 : edi

; rdi = 58 or the first byte,
; unlike in the other version where it had 8 bytes of string data here
mov eax, 0x2000001
syscall

(这个版本看起来要短很多,但大多数额外的行都是空格、注释和标签。优化为 cmp-immediate 使得这 4 条指令而不是5 在 mov eax/syscall 之前,但除此之外它们是相等的。)

关于assembly - 如何将字符串的第一个字符与 x86-64 汇编中的另一个字符进行比较?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54342324/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com