- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
如何在 asm() 中定义指向 XMM 寄存器的指针?就像在循环中访问数组元素一样,如何使用计数器访问 asm 中的寄存器?我试着用下面的代码来做:
float *f=(float*)_aligned_malloc(64,16);
for(int i=0;i<4;i++)
asm volatile
(
"movaps (%1),%%xmm%0"
:
:"r"(i),"r"(f+4*i)
:"%xmm%0"
);
但是编译器给我这个错误:
unknown register name '%xmm%0' in 'asm'
最佳答案
与使用汇编程序宏或实际手动展开相比,这听起来像是一个可怕的想法。如果 gcc 决定不完全展开循环,您的代码将完全中断,因为它只能使用编译时常量索引。
此外,没有办法告诉编译器您将结果放入哪个寄存器,因此这基本上是无用的。我只是作为使用 GNU C 内联汇编语法的愚蠢练习来回答,而不是因为这个答案可能在任何项目中都有用。
就是说,您可以使用 "i"
约束和 a c
operand modifier 来做到这一点将立即数格式化为裸数字,例如 1
而不是 $1
。
void *_aligned_malloc(int, int);
void foo()
{
float *f=(float*)_aligned_malloc(64,16);
for(int i=0;i<4;i++) {
asm volatile (
"movaps %[input],%%xmm%c[regnum]"
:
// only compiles with optimization enabled.
:[regnum] "i"(i), [input] "m"(f[4*i])
:"%xmm0", "%xmm1", "%xmm2", "%xmm3"
);
}
}
gcc 和 clang 与 -O3
能够完全展开并使每次迭代的 i
成为可以匹配 "i 的编译时常量"
约束。 This compiles on Godbolt .
# gcc7.3 -O3
foo():
subq $8, %rsp
movl $16, %esi
movl $64, %edi
call _aligned_malloc(int, int) # from a dummy prototype so it compiles
movaps (%rax),%xmm0
movaps 16(%rax),%xmm1 # compiler can use addressing modes because I switched to an "m" constraint
movaps 32(%rax),%xmm2
movaps 48(%rax),%xmm3
vzeroupper # XMM clobbers also include YMM, and I guess gcc assumes you might have dirtied the upper lanes.
addq $8, %rsp
ret
请注意,我只告诉编译器读取每组 4 的第一个 float
。
ICC -O3
显示 灾难性错误:即使使用
。当然,在禁用优化的情况下,gcc 和 clang 也有同样的问题。例如,gcc -O0 会说:-O3
也无法匹配 asm 操作数约束
<source>: In function 'void foo()':
<source>:11:10: warning: asm operand 0 probably doesn't match constraints
);
^
<source>:11:10: error: impossible constraint in 'asm'
Compiler returned: 1
因为没有优化,i
不是编译时常量,无法匹配 "i"
(立即数)约束。
显然您不能使用"r"
约束;如果编译器选择了 eax
,这将用类似 %xmm%eax
的内容填充 asm 模板。
无论如何,这是没有用的,因为你不能使用目标寄存器。您所能做的就是告诉编译器所有可能的目标寄存器都被破坏了。在一个 asm 语句中写入一个被破坏的寄存器然后假设该值在后面的 asm 语句中仍然存在是不安全的。
x86 与所有其他架构一样,无法使用运行时值索引架构寄存器。寄存器编号必须硬编码到指令流中。
(某些微 Controller ,如 AVR,具有内存映射寄存器,因此您可以通过索引别名寄存器文件的内存来索引它们。但这种情况很少见,x86 不会这样做。它会干扰输出 -以类似于自修改代码的方式按顺序执行。顺便说一句,SMC(或分支到指令的 16 个不同版本之一)是寄存器文件运行时索引的唯一选项。)
关于c - asm 中的寄存器数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48977313/
我需要处理来自旧 Mac 时代(旧摩托罗拉 CPU)的文件。字节是大端字节序,所以我有一个函数可以将 Int64 交换为英特尔小端字节序。该函数是 ASM,可在 32 位 CPU 上运行,但不能在 6
1.概述 转载:史上最通俗易懂的ASM教程 一勺思想 We are all in the gutter, but some of us are looking at the stars. (我们都生活
1.概述 转载:ASM 与 Presto 动态代码生成简介 代码生成是很多计算引擎中常用的执行优化技术,比如我们熟悉的 Apache Spark 和 Presto 在表达式等地方就使用到代码生成技术。
我想在 C++ 程序中使用 ASM 调用地址为 774a7fdch 的函数(kernel32.dll 函数) 我正在使用 Visual Studio 2010。 我该怎么做? call 774a7fd
我是否正确转换了它? 原始 VS C++ 版本: _TEB *pTeb = NULL; _asm { mov eax, fs:[0x18];
阅读自howto_add_systemcall "In general, header files for machine architecture independent system calls
在实现无锁数据结构和时序代码时,通常需要抑制编译器的优化。通常人们使用 asm volatile 和 clobber 列表中的 memory 来执行此操作,但有时您只会看到 asm volatile
这个“strcpy”函数的目的是将src的内容复制到dest,结果很好:显示两行“Hello_src”。 #include static inline char * strcpy(char * de
我正在尝试进行一些汇编编码,我从 C 语言调用函数。代码本身运行良好,但我有两个巨大的问题在很长一段时间内无法解决。第一个是语法高亮 - 我安装了两个不同的(当时一个)asm 高亮扩展到 Visual
我正在研究一些类文件分析,并且正在研究使用 ASM 来读取类。在 Javap 中,操作码以及 tagName 和 tagValue 是内联打印的,但在每个 AbstractInsnNode 中,我只看
我正在尝试弄清楚如何将 ASM 中的 DB 变量用于内联 ASM C++ 我有这个 ASM 代码: filename db "C:\imagen.bmp" eti0: mov ah,3dh mov a
这个“strcpy”函数的目的是将src的内容复制到dest,结果很好:显示两行“Hello_src”。 #include static inline char * strcpy(char * de
在 mm/memory.c 中,它包含一个文件: #include tlb.h 是 include/asm-generic/tlb.h或 arch/arm/include/asm/tlb.h ? 最
你好我找到了一个asm代码......它被集成到c++项目中 template T returned; BYTE *tem = buffer; __asm { mov eax, tem
问题:当我运行 @ 命令提示符 >tasm HelloWorld.asm 顺便说一句,我在输入文件名 HelloWorld.asm 时使用 TAB,所以没有错字.我收到这个致命的命令行错误: Turb
尝试通过 eax 从 asm proc 返回一个 long int,后来又尝试通过 dx:ax。两者都不适合我,因为 C printf 打印的数字与所需的 320L 不同。 x.asm: .model
这是 godbolt 生成的代码. 下面是 Visual Studio 在我的 main.asm 文件上生成的相同代码(通过 Project->C/C++->Output Files->Assembl
在构建具有依赖项的 giraph jar 时,我们收到以下警告.. 真的不知道如何解决这些.. 我们已经尝试过了 useProjectArtifact 为 false 和 解压为真 两者似乎都有效 任
我正在使用 gentoo 并尝试编译一个程序来控制并行端口上的位。它的顶部附近有这条线: #include 当我尝试在其上使用 gcc 时,它会产生以下输出: port.c:4:20: error:
(原帖)将 hibernate 依赖项添加到 pom.xml 时显示错误 2011-10-11 10:36:53.710::WARN: failed guiceFilter java.lang.No
我是一名优秀的程序员,十分优秀!