assembly - 如何遍历汇编中的字符串，直到到达null？ (strlen循环)-6ren

assembly - 如何遍历汇编中的字符串，直到到达null？ (strlen循环)

转载作者：行者123 更新时间：2023-12-02 21:57:17

25

4

现在，我只是想知道如何遍历字符串。如果代码没有意义，那是因为我将某些信息解释为错误的。最糟糕的是，我真的不知道自己在做什么。

strlen:

pushq %rbx
movq %rsi, %rbx


loop:
    cmp $0x00, (%rdi, %rbx)
    je end
    inc %rbx
    jmp loop

end:
    movq %rbx, %rax
    popq %rbx
    ret

PS：有一个原因使我的头衔看起来像是一个老头，第二次在他的计算机上尝试搜索“如何去google.com”。Superrrrnoob在这里试图学习一些汇编语言。我正在尝试为自己实现strlen函数。

最佳答案

您只需inc %rbx即可增加指针值。 (%rbx)使用其值作为内存地址来取消引用该寄存器。在x86上，每个字节都有其自己的地址（此属性称为“可字节寻址的字节”），而地址只是适合寄存器的整数。

ASCII字符串中的字符全为1字节宽，因此将指针加1将移至ASCII字符串中的下一个字符。（对于UTF-8且字符在1..127码点范围之外的一般情况，情况并非如此，但是ASCII是UTF-8的子集。）

术语：ASCII码0被称为NUL（一个L），而不是NULL。在C中，NULL是指针概念。 C样式的隐式长度字符串可以描述为0终止或NUL终止，但是“ null终止”滥用了该术语。

您应该选择一个不同的寄存器（称为调用寄存器），这样就无需在函数中推送/弹出该寄存器。您的代码不会进行任何函数调用，因此无需将归纳变量保留在调用保留的寄存器中。

在其他SO Q＆A中，我没有找到一个很好的简单示例。它们或者在循环内有2个分支（包括一个无条件的jmp），就像我在注释中链接的那样，或者浪费指令增加一个指针和一个计数器。在循环中使用索引寻址模式并不可怕，但是在某些CPU上效率较低，因此我仍然建议在循环后执行指针增量->减去结束起始。

这就是我写一个最小的strlen的方式，它一次只检查1个字节（缓慢而简单）。我使循环本身保持较小，这是IMO总体上编写循环的一种好方法的合理示例。通常，保持代码紧凑会更容易理解asm中的函数。（给它一个不同于strlen的名称，这样您就可以测试它而无需gcc -fno-builtin-strlen或其他任何东西。）

.globl simple_strlen
simple_strlen:
    lea     -1(%rdi), %rax     # p = start-1 to counteract the first inc
 .Lloop:                       # do {
    inc     %rax                  # ++p
    cmpb    $0, (%rax)
    jne     .Lloop             # }while(*p != 0);
                           # RAX points at the terminating 0 byte = one-past-end of the real data
    sub     %rdi, %rax     # return length = end - start
    ret

strlen的返回值是 0字节的数组索引=不包括终止符的数据长度。

如果您手动进行内联（因为这只是3条指令的循环），则通常只需要指向0终止符的指针，这样就不会打扰子废话，只需在循环结束时使用RAX。

可以通过剥离第一次迭代来避免在第一次加载之前偏移LEA / INC指令（在第一次cmp之前花费2个周期的等待时间），这可以通过在第一次加载后剥离，或者使用 jmp进入cmp / jne处的循环来完成。公司 Why are loops always compiled into "do...while" style (tail jump)?。

在cmp / jcc之间（如 cmp; lea 1(%rax), %rax; jne），用LEA递增指针可能会更糟，因为它会使cmp / jcc的宏融合失败成为单个uop。（实际上， cmp $imm, (%reg) / jcc的宏融合在像Skylake这样的Intel CPU上都不会发生。 cmp微融合内存操作数。也许AMD融合了cmp / jcc。）另外，您将离开RAX 1高于您想要的循环。

因此，对 movzx（又名 movzbl）加载并将字节零扩展到 %ecx和 test %ecx, %ecx / jnz中，与循环条件一样有效（在Intel Sandybridge系列上）。但是更大的代码大小。

大多数CPU将在每个时钟周期1次迭代中运行我的循环。通过一些循环展开，我们可能每个周期接近2个字节（尽管仍然仅单独检查每个字节）。

对于大型字符串，一次检查1个字节比使用SSE2慢大约16倍。如果您不打算最小化代码大小和简化代码，请参见 Why is this code 6.5x slower with optimizations enabled?以获取使用XMM寄存器的简单SSE2 strlen。 SSE2是x86-64的基线，因此您应该在提速时始终使用它，因为值得在asm中手工编写的内容。

回复：您的更新问题带有来自 Why does rax and rdi work the same in this situation?的实现错误的移植

RDI和RBX都保存指针。将它们加在一起不会成为有效地址！在您尝试移植的代码中，RCX（索引）在循环之前被初始化为零。但是您没有使用 xor %ebx, %ebx，而是使用了 mov %rdi, %rbx。单步执行代码时，请使用调试器检查寄存器值。

关于assembly - 如何遍历汇编中的字符串，直到到达null？ (strlen循环)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60482733/

25

4

0

文章推荐： callback - P5.js createCapture失败回调

文章推荐： juice-ui - JuiceUI - 'jQuery' 未定义

文章推荐： facebook - 分享此 Facebook 分享说明不起作用

汇编 - 在图形模式下打印一个字符
我试图在图形模式下打印一个字符。通常当我打印我正在做的一个字符时: mov ah,14 ; ah=14 mov al,'x' int 10h ; print the character 这
汇编 - 试图将字节移动到内存不起作用
我试图通过更改其中的一个字节来修改存储在内存中的字符串。我为此使用了 movb，但由于某种原因，给定内存位置的字节没有改变。在 gdb 调试器上: 14 movb %al, (%r10) # nex
汇编-x86调用指令和内存地址？
我一直在阅读一些汇编代码，并且开始发现调用指令实际上是与程序计数器相关的。但是，每当我使用 Visual Studio 或 Windbg 进行调试时，它总是显示 call 0xFFFFFF ...这
汇编、栈上局部变量的算术运算
我最近一直在使用 Visual C++ 中的内联汇编，我想知道是否可以直接向堆栈上的局部变量添加值，例如: push 5 add [esp], 7 这样做可以吗？我问这个问题是因为我在执行此操作时随机
汇编-进位标志VS溢出标志
我有下一个代码: mov al, -5 add al, 132 add al, 1 据我检查，溢出标志和进位标志将在第一个操作中设置，而在第二个操作中，仅设置溢出。但我不明白为什么: 在无符号数中，
汇编，将单个字节从寄存器写入内存会覆盖其他字节
在 64 位 x86 汇编 nasm 中，如何将单个字节从寄存器移动到 .data 节中定义的内存位置？我知道这有效 global _main section .data quotient db 0
汇编、打印ascii码
我的汇编代码有问题。我想打印存储在寄存器 cx 中的数字，但是当我尝试打印它时，它打印的是 ascii 字符而不是 ascii 数字，所以我决定编写一个程序将 ascii char 转换为 ascii
汇编——机器码中的跳转指令
为什么第 1B 行的跳转指令(例如)变成了 EBBD？我知道“jmp”= EB但是BD是怎么计算的呢？最佳答案短跳转使用一个带符号的偏移量添加到 JMP 之后的指令地址。例如，第一个 JMP
汇编:add指令和操作符add的区别
以下两者有什么区别: mov eax, [eax+4] 和 add eax, 4 mov eax, [eax] 如果不是，那么汇编器是否会选择哪个来进行某种优化？最佳答案这
汇编/反汇编指令操作数
看《The Shellcoder's Handbook》中的一些汇编和反汇编代码，发现一条指令的序列操作数是不一样的。例如，在 assembly 上: mov ebx,0 并且，在反汇编时: mov
汇编，检测溢出寄存器
我有这个非常简单的汇编代码: start: add ax, 100 ; if ax overflow add to bx 1 jmp start 但我不知道如何检测 ax 寄存器溢出，有人可以帮
汇编，将单个字节从寄存器写入内存会覆盖其他字节
在 64 位 x86 汇编 nasm 中，如何将单个字节从寄存器移动到 .data 节中定义的内存位置？我知道这有效 global _main section .data quotient db 0
汇编、打印ascii码
我的汇编代码有问题。我想打印存储在寄存器 cx 中的数字，但是当我尝试打印它时，它打印的是 ascii 字符而不是 ascii 数字，所以我决定编写一个程序将 ascii char 转换为 ascii
汇编 << 运算符
我正在学习一些关于操作系统开发的教程，我发现了一篇关于多重引导 header 。这些是您必须定义的一些“神奇”值才能使用GRUB2。这些是命令: # Declare constants used f
汇编——机器码中的跳转指令
为什么第 1B 行的跳转指令(例如)变成了 EBBD？我知道“jmp”= EB但是BD是怎么计算的呢？最佳答案短跳转使用一个带符号的偏移量添加到 JMP 之后的指令地址。例如，第一个 JMP
从内存地址复制字辅助(汇编)
我正在尝试从内存中复制一些单词并使用汇编将其保存到另一个内存地址。我正在尝试为其编写代码，但我不确定其中的某些部分。我将简要描述我想要做什么。源地址、目标地址和要复制的字数是函数的输入参数。最佳答
汇编 MOV 指令操作数
当我们想要像这样创建一个初始化变量时: name db 'zara ali' 我们创建了一个字节大小变量，但我们在其中存储了一个字符串这怎么可能？？当我们使用这条指令时: MOV ecx, nam
汇编:16 位除法
我还是汇编的新手，我还不知道汇编中的许多命令代码。我想在 16 位寄存器中进行除法。我想打印它的内容。我知道我需要将寄存器的内容转换为 ASCII 进行打印，但同样，我的问题是除法。请帮我。比如cx
assembly - 汇编/机器代码中相等的分支
使用有什么区别: c.eq.s $1, $2 bc1t L2 并使用: beq $1, $2, L2 如果他们做同样的事情，为什么有两种分支方式？如果它们不同，那么它们各自的好处是什么
c - 汇编:在调用函数之前加载有效地址的目的？
源代码: int main() { int i; for(i=0, i : push rbp 2. 0x000055555555463b :

首页

博学

6Ren·AI

商城

assembly - 如何遍历汇编中的字符串，直到到达null？ (strlen循环)