- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个函数,它接受3个参数,dest,src0,src1,每个参数指向大小为12的数据。我制作了两个版本。一个是用C编写并由编译器优化的,另一个是完全用_asm编写的。是的。 3个论点?我自然会做类似的事情:
mov ecx, [src0]
mov edx, [src1]
mov eax, [dest]
_src0$ = -8 ; size = 4
_dest$ = -4 ; size = 4
_src1$ = 8 ; size = 4
?vm_vec_add_scalar_asm@@YAXPAUvec3d@@PBU1@1@Z PROC ; vm_vec_add_scalar_asm
; _dest$ = ecx
; _src0$ = edx
; 20 : {
sub esp, 8
mov DWORD PTR _src0$[esp+8], edx
mov DWORD PTR _dest$[esp+8], ecx
; 21 : _asm
; 22 : {
; 23 : mov ecx, [src0]
mov ecx, DWORD PTR _src0$[esp+8]
; 24 : mov edx, [src1]
mov edx, DWORD PTR _src1$[esp+4]
; 25 : mov eax, [dest]
mov eax, DWORD PTR _dest$[esp+8]
Function body etc.
add esp, 8
ret 0
_src1$ = 8 ; size = 4
?vm_vec_add@@YAXPAUvec3d@@PBU1@1@Z PROC ; vm_vec_add
; _dest$ = ecx
; _src0$ = edx
mov eax, DWORD PTR _src1$[esp-4]
最佳答案
Mats Petersson的答案解释了__fastcall
。但是我想那不完全是你要的...
实际上,_src0$[esp+8]
仅表示[_src0$ + esp + 8]
,而_src0$
的定义如上:
_src0$ = -8 ; size = 4
_src0$[esp+8]
只不过是
[esp]
...
__fastcall
,或更一般地说,什么是调用约定。有关详细信息,请参见他的文章中的链接。
__fastcall
,现在让我们看看您的代码会发生什么。编译器正在使用
__fastcall
。您的被调用方函数是
f(dst, src0, src1)
,它需要
3
参数,因此根据调用约定,当调用方调用
f
时,它将执行以下操作:
dst
移至
ecx
并将
src0
移至
edx
src1
推入堆栈
f
的起始地址
f
在其代码开始时便知道参数的位置:
dst
和
src0
分别位于寄存器
ecx
和
edx
中;
esp
指向4个字节的返回地址,但它下面的4个字节(即DWORD PTR [esp + 4])恰好是
src1
。
f
会执行应做的工作:
mov eax, DWORD PTR _src1$[esp-4]
_src1$ = 8
,所以
_src1$[esp-4]
恰好是
[esp+4]
。看,它只是检索参数
src1
并将其存储在
eax
中。
f
代码中,如果要多次使用参数
src1
,则可以这样做,因为它始终存储在堆栈中,位于返回地址的正下方;但是如果您想多次使用
dst
和
src0
怎么办?它们在寄存器中,可以随时销毁。
f
之后,它应该记住
ecx
和
edx
的当前值(通过将它们压入堆栈)。这8个字节就是所谓的“影子空间”。在您的“ C ++版本”中未完成此操作,可能是因为编译器确定不会多次使用这两个参数,或者可以以其他方式正确地处理这两个参数。
_asm
版本会怎样?这里的问题是您正在使用内联汇编。然后,编译器将失去对寄存器的控制,并且不能假定寄存器
ecx
和
edx
在
_asm
块中是安全的(实际上不是,因为您在
_asm
块中使用了它们)。因此,必须在函数开始时保存它们。
esp
增大8个字节(
sub esp, 8
),然后将
edx
和
ecx
分别移到
[esp]
和
[esp+4]
。
_asm
块。现在想到的是(如果有),图片是
[esp]
是
src0
,
[esp+4]
是
dst
,
[esp+8]
是4字节返回地址,而
[esp+12]
是
src1
。它不再考虑
ecx
和
edx
。
_asm
块中的第一条指令
mov ecx, [src0]
应该解释为
mov ecx, [esp]
,与
mov ecx, DWORD PTR _src0$[esp+8]
f
源文件中编写汇编函数
.asm
,然后在
public
中编写。在
C/C++
代码中,将其声明为
extern 'C' f(...)
。然后,当您开始使用汇编功能
f
时,可以直接使用
ecx
和
edx
进行播放。
关于c++ - MSVC汇编函数自变量C++与_asm,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31527692/
我试图在图形模式下打印一个字符。通常当我打印我正在做的一个字符时: mov ah,14 ; ah=14 mov al,'x' int 10h ; print the character 这
我试图通过更改其中的一个字节来修改存储在内存中的字符串。我为此使用了 movb,但由于某种原因,给定内存位置的字节没有改变。 在 gdb 调试器上: 14 movb %al, (%r10) # nex
我一直在阅读一些汇编代码,并且开始发现调用指令实际上是与程序计数器相关的。 但是,每当我使用 Visual Studio 或 Windbg 进行调试时,它总是显示 call 0xFFFFFF ...这
我最近一直在使用 Visual C++ 中的内联汇编,我想知道是否可以直接向堆栈上的局部变量添加值,例如: push 5 add [esp], 7 这样做可以吗?我问这个问题是因为我在执行此操作时随机
我有下一个代码: mov al, -5 add al, 132 add al, 1 据我检查,溢出标志和进位标志将在第一个操作中设置,而在第二个操作中,仅设置溢出。 但我不明白为什么: 在无符号数中,
在 64 位 x86 汇编 nasm 中,如何将单个字节从寄存器移动到 .data 节中定义的内存位置? 我知道这有效 global _main section .data quotient db 0
我的汇编代码有问题。我想打印存储在寄存器 cx 中的数字,但是当我尝试打印它时,它打印的是 ascii 字符而不是 ascii 数字,所以我决定编写一个程序将 ascii char 转换为 ascii
为什么第 1B 行的跳转指令(例如)变成了 EBBD? 我知道“jmp”= EB但是BD是怎么计算的呢? 最佳答案 短跳转使用一个带符号的偏移量添加到 JMP 之后的指令地址。 例如,第一个 JMP
以下两者有什么区别: mov eax, [eax+4] 和 add eax, 4 mov eax, [eax] 如果不是,那么汇编器是否会选择哪个来进行某种优化? 最佳答案 这
看《The Shellcoder's Handbook》中的一些汇编和反汇编代码,发现一条指令的序列操作数是不一样的。 例如,在 assembly 上: mov ebx,0 并且,在反汇编时: mov
我有这个非常简单的汇编代码: start: add ax, 100 ; if ax overflow add to bx 1 jmp start 但我不知道如何检测 ax 寄存器溢出,有人可以帮
在 64 位 x86 汇编 nasm 中,如何将单个字节从寄存器移动到 .data 节中定义的内存位置? 我知道这有效 global _main section .data quotient db 0
我的汇编代码有问题。我想打印存储在寄存器 cx 中的数字,但是当我尝试打印它时,它打印的是 ascii 字符而不是 ascii 数字,所以我决定编写一个程序将 ascii char 转换为 ascii
我正在学习一些关于操作系统开发的教程,我发现了一篇关于多重引导 header 。这些是您必须定义的一些“神奇”值才能使用GRUB2。这些是命令: # Declare constants used f
为什么第 1B 行的跳转指令(例如)变成了 EBBD? 我知道“jmp”= EB但是BD是怎么计算的呢? 最佳答案 短跳转使用一个带符号的偏移量添加到 JMP 之后的指令地址。 例如,第一个 JMP
我正在尝试从内存中复制一些单词并使用汇编将其保存到另一个内存地址。我正在尝试为其编写代码,但我不确定其中的某些部分。我将简要描述我想要做什么。 源地址、目标地址和要复制的字数是函数的输入参数。 最佳答
当我们想要像这样创建一个初始化变量时: name db 'zara ali' 我们创建了一个字节大小变量,但我们在其中存储了一个字符串 这怎么可能?? 当我们使用这条指令时: MOV ecx, nam
我还是汇编的新手,我还不知道汇编中的许多命令代码。我想在 16 位寄存器中进行除法。我想打印它的内容。我知道我需要将寄存器的内容转换为 ASCII 进行打印,但同样,我的问题是除法。请帮我。 比如cx
使用有什么区别: c.eq.s $1, $2 bc1t L2 并使用: beq $1, $2, L2 如果他们做同样的事情,为什么有两种分支方式?如果它们不同,那么它们各自的好处是什么
源代码: int main() { int i; for(i=0, i : push rbp 2. 0x000055555555463b :
我是一名优秀的程序员,十分优秀!