- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
现在,我只是想知道如何遍历字符串。如果代码没有意义,那是因为我将某些信息解释为错误的。最糟糕的是,我真的不知道自己在做什么。
strlen:
pushq %rbx
movq %rsi, %rbx
loop:
cmp $0x00, (%rdi, %rbx)
je end
inc %rbx
jmp loop
end:
movq %rbx, %rax
popq %rbx
ret
最佳答案
您只需inc %rbx
即可增加指针值。 (%rbx)
使用其值作为内存地址来取消引用该寄存器。在x86上,每个字节都有其自己的地址(此属性称为“可字节寻址的字节”),而地址只是适合寄存器的整数。
ASCII字符串中的字符全为1字节宽,因此将指针加1将移至ASCII字符串中的下一个字符。 (对于UTF-8且字符在1..127码点范围之外的一般情况,情况并非如此,但是ASCII是UTF-8的子集。)
术语:ASCII码0
被称为NUL(一个L),而不是NULL。在C中,NULL是指针概念。 C样式的隐式长度字符串可以描述为0终止或NUL终止,但是“ null终止”滥用了该术语。
您应该选择一个不同的寄存器(称为调用寄存器),这样就无需在函数中推送/弹出该寄存器。您的代码不会进行任何函数调用,因此无需将归纳变量保留在调用保留的寄存器中。
在其他SO Q&A中,我没有找到一个很好的简单示例。它们或者在循环内有2个分支(包括一个无条件的jmp),就像我在注释中链接的那样,或者浪费指令增加一个指针和一个计数器。在循环中使用索引寻址模式并不可怕,但是在某些CPU上效率较低,因此我仍然建议在循环后执行指针增量->减去结束起始。
这就是我写一个最小的strlen的方式,它一次只检查1个字节(缓慢而简单)。我使循环本身保持较小,这是IMO总体上编写循环的一种好方法的合理示例。通常,保持代码紧凑会更容易理解asm中的函数。 (给它一个不同于strlen
的名称,这样您就可以测试它而无需gcc -fno-builtin-strlen
或其他任何东西。)
.globl simple_strlen
simple_strlen:
lea -1(%rdi), %rax # p = start-1 to counteract the first inc
.Lloop: # do {
inc %rax # ++p
cmpb $0, (%rax)
jne .Lloop # }while(*p != 0);
# RAX points at the terminating 0 byte = one-past-end of the real data
sub %rdi, %rax # return length = end - start
ret
strlen
的返回值是
0
字节的数组索引=不包括终止符的数据长度。
jmp
进入cmp / jne处的循环来完成。公司
Why are loops always compiled into "do...while" style (tail jump)?。
cmp
;
lea 1(%rax), %rax
;
jne
),用LEA递增指针可能会更糟,因为它会使cmp / jcc的宏融合失败成为单个uop。 (实际上,
cmp $imm, (%reg)
/ jcc的宏融合在像Skylake这样的Intel CPU上都不会发生。
cmp
微融合内存操作数。也许AMD融合了cmp / jcc。)另外,您将离开RAX 1高于您想要的循环。
movzx
(又名
movzbl
)加载并将字节零扩展到
%ecx
和
test %ecx, %ecx
/
jnz
中,与循环条件一样有效(在Intel Sandybridge系列上)。但是更大的代码大小。
xor %ebx, %ebx
,而是使用了
mov %rdi, %rbx
。单步执行代码时,请使用调试器检查寄存器值。
关于assembly - 如何遍历汇编中的字符串,直到到达null? (strlen循环),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60482733/
我试图在图形模式下打印一个字符。通常当我打印我正在做的一个字符时: mov ah,14 ; ah=14 mov al,'x' int 10h ; print the character 这
我试图通过更改其中的一个字节来修改存储在内存中的字符串。我为此使用了 movb,但由于某种原因,给定内存位置的字节没有改变。 在 gdb 调试器上: 14 movb %al, (%r10) # nex
我一直在阅读一些汇编代码,并且开始发现调用指令实际上是与程序计数器相关的。 但是,每当我使用 Visual Studio 或 Windbg 进行调试时,它总是显示 call 0xFFFFFF ...这
我最近一直在使用 Visual C++ 中的内联汇编,我想知道是否可以直接向堆栈上的局部变量添加值,例如: push 5 add [esp], 7 这样做可以吗?我问这个问题是因为我在执行此操作时随机
我有下一个代码: mov al, -5 add al, 132 add al, 1 据我检查,溢出标志和进位标志将在第一个操作中设置,而在第二个操作中,仅设置溢出。 但我不明白为什么: 在无符号数中,
在 64 位 x86 汇编 nasm 中,如何将单个字节从寄存器移动到 .data 节中定义的内存位置? 我知道这有效 global _main section .data quotient db 0
我的汇编代码有问题。我想打印存储在寄存器 cx 中的数字,但是当我尝试打印它时,它打印的是 ascii 字符而不是 ascii 数字,所以我决定编写一个程序将 ascii char 转换为 ascii
为什么第 1B 行的跳转指令(例如)变成了 EBBD? 我知道“jmp”= EB但是BD是怎么计算的呢? 最佳答案 短跳转使用一个带符号的偏移量添加到 JMP 之后的指令地址。 例如,第一个 JMP
以下两者有什么区别: mov eax, [eax+4] 和 add eax, 4 mov eax, [eax] 如果不是,那么汇编器是否会选择哪个来进行某种优化? 最佳答案 这
看《The Shellcoder's Handbook》中的一些汇编和反汇编代码,发现一条指令的序列操作数是不一样的。 例如,在 assembly 上: mov ebx,0 并且,在反汇编时: mov
我有这个非常简单的汇编代码: start: add ax, 100 ; if ax overflow add to bx 1 jmp start 但我不知道如何检测 ax 寄存器溢出,有人可以帮
在 64 位 x86 汇编 nasm 中,如何将单个字节从寄存器移动到 .data 节中定义的内存位置? 我知道这有效 global _main section .data quotient db 0
我的汇编代码有问题。我想打印存储在寄存器 cx 中的数字,但是当我尝试打印它时,它打印的是 ascii 字符而不是 ascii 数字,所以我决定编写一个程序将 ascii char 转换为 ascii
我正在学习一些关于操作系统开发的教程,我发现了一篇关于多重引导 header 。这些是您必须定义的一些“神奇”值才能使用GRUB2。这些是命令: # Declare constants used f
为什么第 1B 行的跳转指令(例如)变成了 EBBD? 我知道“jmp”= EB但是BD是怎么计算的呢? 最佳答案 短跳转使用一个带符号的偏移量添加到 JMP 之后的指令地址。 例如,第一个 JMP
我正在尝试从内存中复制一些单词并使用汇编将其保存到另一个内存地址。我正在尝试为其编写代码,但我不确定其中的某些部分。我将简要描述我想要做什么。 源地址、目标地址和要复制的字数是函数的输入参数。 最佳答
当我们想要像这样创建一个初始化变量时: name db 'zara ali' 我们创建了一个字节大小变量,但我们在其中存储了一个字符串 这怎么可能?? 当我们使用这条指令时: MOV ecx, nam
我还是汇编的新手,我还不知道汇编中的许多命令代码。我想在 16 位寄存器中进行除法。我想打印它的内容。我知道我需要将寄存器的内容转换为 ASCII 进行打印,但同样,我的问题是除法。请帮我。 比如cx
使用有什么区别: c.eq.s $1, $2 bc1t L2 并使用: beq $1, $2, L2 如果他们做同样的事情,为什么有两种分支方式?如果它们不同,那么它们各自的好处是什么
源代码: int main() { int i; for(i=0, i : push rbp 2. 0x000055555555463b :
我是一名优秀的程序员,十分优秀!