gpt4 book ai didi

c++ - 在两个内联汇编调用中与在一个内联汇编调用中相比内存被破坏?

转载 作者:搜寻专家 更新时间:2023-10-31 02:07:32 25 4
gpt4 key购买 nike

这个问题遵循这个 one ,考虑 GCC 兼容的编译器和 x86-64 架构。

我想知道下面的选项 1选项 2选项 3 之间是否有任何区别。结果在所有情况下都是一样的,还是会有所不同。如果是的话会有什么区别?

// Option 1
asm volatile(:::"memory");
asm volatile("CPUID":"=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx):"0"(level):);

// Option 2
asm volatile("CPUID":"=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx):"0"(level):);
asm volatile(:::"memory");

// Option 3
asm volatile("CPUID":"=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx):"0"(level):"memory");

最佳答案

选项 1 和 2 将让 CPUID 本身与不相关的非 volatile 加载/存储(在一个方向或另一个方向)重新排序。这很可能不是您想要的。

您可以在 CPUID 的两侧 放置一个内存屏障,但最好让 CPUID 本身成为一个内存屏障。


正如 Jester 所指出的,选项 1 将强制从内存中重新加载 level,如果它的地址曾经在函数外部传递过,或者如果它已经全局或 static

(或者无论决定 C 变量是否可以被使用 "memory" 破坏的 asm 读取或写入修改的确切标准是什么。我认为它与优化器使用的基本相同决定是否可以通过对不透明函数的非内联函数调用将变量保存在寄存器中,因此没有将其地址传递到任何地方并且不是 asm 语句的输入的纯局部变量仍然可以住在寄存器中)。

例如 ( Godbolt compiler explorer ):

void foo(int level){
int eax, ebx, ecx, edx;
asm volatile("":::"memory");
asm volatile("CPUID"
: "=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx)
: "0"(level)
:
);
}

# x86-64 gcc7.3 -O3 -fverbose-asm

pushq %rbx # # rbx is call-preserved, but we clobber it.
movl %edi, %eax # level, eax
CPUID
popq %rbx #
ret

请注意缺少函数 arg 的溢出/重新加载。

通常我会使用 Intel 语法,但对于内联汇编,最好始终使用 AT&T,除非你完全讨厌 AT&T 语法或不知道它。

即使它在内存中启动(i386 System V 调用约定,带有堆栈参数),编译器仍然决定没有任何其他内容(包括带有内存破坏的 asm 语句)可以引用它。但是我们如何分辨延迟加载之间的区别呢?修改barrier之前的函数arg,然后在barrier之后使用:

void modify_level(int level){
level += 1; // modify level before the barrier
int eax, ebx, ecx, edx;
asm volatile("#mem barrier here":::"memory");
asm volatile("CPUID" // then read it after
: "=a"(eax),"=b"(ebx),"=c"(ecx),"=d"(edx)
: "0"(level):);
}

gcc -m32 -O3 -fverbose-asm 的 asm 输出是:

modify_level(int):
pushl %ebx #
#mem barrier here
movl 8(%esp), %eax # level, tmp97
addl $1, %eax #, level
CPUID
popl %ebx #
ret

请注意,编译器让 level++ 跨内存屏障重新排序,因为它是一个局部变量。

Godbolt 过滤手写的 asm 注释以及编译器生成的 asm 注释行。我禁用了评论过滤器并找到了内存屏障。您可能想要删除 -fverbose-asm 以减少噪音。或者为 mem 屏障使用非注释字符串:如果您只是查看编译器的 asm 输出,则不必进行汇编。 (除非您使用的是内置汇编器的 clang)。


顺便说一句,你的问题的原始版本没有编译:你遗漏了空字符串作为 asm 模板。 汇编(:::“内存”)。输出、输入和 clobber 部分可以为空,但 asm 指令字符串不是可选的。

有趣的是,您可以在字符串中添加 asm 注释:

asm volatile("# memory barrier here":::"memory");

gcc 在写入 asm 输出时填充字符串模板中的任何 %whatever 内容,因此您甚至可以执行诸如 "CPUID # %%0 was in %0" 并查看 gcc 为您的“虚拟”参数选择了什么,这些参数在 asm 模板中未提及。 (当你给 asm 语句一个指针时,虚拟内存输入/输出操作数告诉编译器你读/写哪个内存而不是使用 “memory” clobber 更有趣。)

关于c++ - 在两个内联汇编调用中与在一个内联汇编调用中相比内存被破坏?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48526388/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com