gpt4 book ai didi

linux - 如何在 x86 汇编中编写我自己的 atoi 函数

转载 作者:太空狗 更新时间:2023-10-29 12:39:09 27 4
gpt4 key购买 nike

我在汇编中编写自己的 atoi 函数时遇到了一些问题。说明是

“更改函数,使其返回传递给函数的 C 字符串(指针)的整数等价物。您可以假设第一个字符在‘0’和‘9’之间,包括在内。ato 应该考虑从第一个到第一个不是十进制数字的字符的所有字符。如您所见,main 使用 atoia 返回的值作为退出代码(这只是一种访问 atoi 输出的廉价方法,无需编写 itoafunction .)如您所见,atoire 返回 1234。返回值与 0xFF 进行与操作以将其缩减为一个字节。因此 1234 和 255 变成 210。”

    # Useful constants 
.equ STDIN,0
.equ STDOUT,1
.equ READ,0
.equ WRITE,1
.equ EXIT,60
# Stack frame
.equ bufferSize, 32
.equ buffer,-bufferSize
.equ localSize,16
.equ frameSize, bufferSize + localSize
# Read only data
.section .rodata # the read-only data section
prompt:
.string "Enter an integer: "
.equ promptSz,.-prompt-1
msg:
.string "You entered: "
.equ msgSz,.-msg-1

代码

    .text   # switch to text section 


.globl __start
__start:
pushq %rbp # save caller’s frame pointer
movq %rsp, %rbp # establish our frame pointer
subq $frameSize, %rsp # for local variables

movl $promptSz, %edx # prompt size
movl $prompt, %esi # address of prompt text string
movl $STDOUT, %edi # standard out
movl $WRITE, %eax
syscall # request kernel service

movl $bufferSize,%edx
leaq buffer(%rbp), %rsi # load buffer address
movl $STDIN, %edi # standard in
movl $READ, %eax
syscall # request kernel service
movl %eax, (%rsp) # store num chars read

leaq buffer(%rbp), %rsi # load buffer address
call atoi # our exit code will be the return from atoi

movq %rbp, %rsp # delete local variables
popq %rbp # restore caller’s frame pointer
movl %eax, %edi # put exit status in %edi (will be ANDed with FF)
movl $EXIT, %eax # exit from this process

syscall

基本代码如下所示,我只需要实现自己的 atoi。到目前为止,我对 atoi 函数的了解是

atoi:
pushq %rbp # save caller’s frame pointer
movq %rsp, %rbp # establish our frame pointer
subq $16, %rsp # for local variables

movq %rdi, -16(%rbp) #moving first argument to local variable
movl $0, -4(%rbp) #moving 0 to local variable
movl $10, -12(%rbp) #moving 10 to local variable

movl -16(%rbp), %rax
movzbl (%rax), %eax #getting value of rax
movl -4(%rbp), %eax

imull -12(%rbp), %eax
movl %eax, -4(%rbp)

movq %rbp, %rsp # delete local variables
popq %rbp # restore caller’s frame pointer
ret

我不知道下一步该去哪里。似乎我所做的任何事情都会给我段错误

最佳答案

您过度使用局部变量(而未充分使用寄存器);将需要一个在发现无效字符时停止的循环;并且可能使用了错误的调用约定(系统调用看起来像 Linux,这意味着 System V AMD64 ABI,这意味着参数在寄存器中传递,而不是在堆栈中传递)。

请注意,这完全可以在没有任何局部变量的情况下完成。例如(NASM 语法,因为我不做 AT&T,未经测试):

;Convert string to integer
;
;Input
; rdi = first parameter (address of string)
;
;Output
; rax = result

atoi:
xor rax,rax ;rax = 0 (this will become the returned result)
.nextChar:
movzx rcx,byte [rdi] ;rcx = next character
sub rcx,'0' ;rcx = value of next digit
jb .done ;Invalid character (too low to be a decimal digit)
cmp rcx,9 ;Was it too high to be a decimal digit?
ja .done ; yes, invalid

lea rax,[rax*4+rax] ;rax = result*5
lea rax,[rax*2+rcx] ;rax = result*5*2 + digit = result*10 + digit
inc rdi ;rdi = address of next character
jmp .nextChar
.done:
ret

注意:此代码不适用于负值(例如以 '-' 开头的字符串),并且如果/当结果溢出时不会返回错误条件。结果也将是 64 位的(而 int 可能应该是 32 位的)。大多数情况下,它是“转换为 unsigned long long”(错误处理与 atoi() 一样糟糕)。

关于linux - 如何在 x86 汇编中编写我自己的 atoi 函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55565450/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com