作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我必须在我的 C 程序中使用 Ubuntu 上的 GCC 编译器将以下语句作为内联汇编代码编写。
__int128 X = (__int128)F[0]*T[0]+(__int128)F[1]*T[1]+(__int128)F[2]*T[2]);
其中 F 是无符号 64 位整数数组,T 是有符号 64 位整数数组。数组 F 作为参数通过引用传递,而 T 是本地数组。以上声明我翻译如下
__asm__("movq %0, %%rax; imulq %1; movq %%rax, %%xmm0; movq %%rdx, %%xmm1;"
::"m"(F[0]), "m"(T[0]));
__asm__("movq %0, %%rax; imulq %1; movq %%xmm0, %%rcx; addq %%rcx, %%rax;"
"movq %%rax, %%xmm0; movq %%xmm1, %%rcx; adcq %%rcx, %%rdx;"
"movq %%rdx, %%xmm1;"
::"m"(F[1]), "m"(T[1]));
__asm__("movq %2, %%rax; imulq %3; movq %%xmm0, %%rcx; addq %%rcx, %%rax;"
"movq %%rax, %?; movq %%xmm1, %%rcx; adcq %%rcx, %%rdx;"
"movq %%rdx, %?;"
:"=m"(??), "=m"(??):"m"(F[2]), "m"(T[2]));
第一个也是最重要的问题是我做得对吗?如果是,那么我不知道如何将结果存储到 X 中,因为结果的低 64 位在 rax 中,高 64 位在 rdx 中。我已经检查过我是否可以替换?? X,那么我得到了错误的结果。
使用xmm寄存器进行存储是有原因的。因此,由于我对内联汇编还很天真,所以我认为有更好的方法可以做到这一点。我用上面的内联汇编代码检查了我的程序,没有错误。任何帮助或改进建议将不胜感激。
最佳答案
您正在对 F 进行符号扩展。由于没有带符号 * 无符号乘法指令,因此必须显式地进行符号扩展(16 位到 32 位示例):
(0xFFFF0000 + S) * U
= 0xFFFF0000 * U + S * U
= (0x100000000 - 0x10000) * U + S * U
= 0x100000000 * U - 0x10000 * U + S * U
= S * U - 0x10000 * U (don't care about high bits)
您不能依赖内联 asm 语句 block 之间的寄存器中保留的值;你必须使用变量。所有修改的寄存器都必须声明为输出或破坏。
例如,U
(一个 64 位无符号值)和 S
(一个 64 位有符号值)的单次乘法:
__int128 X;
uint64_t Utmp = U;
asm ("mov %1, %%rax;"
"mul %2;"
"test %2, %2;"
"cmovns %3, %1;"
"sub %1, %%rdx"
: "=&A" (X), "+r" (Utmp) : "r" (S), "rm" (0UL));
编辑:无需零输入即可完成:
int64_t Stmp = S;
asm ("mov %1, %%rax;"
"mul %2;"
"sar $63, %1;"
"and %2, %1;"
"sub %1, %%rdx"
: "=&A" (X), "+rm" (Stmp) : "r" (U));
关于c - 内联汇编代码并存储 128 位结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35583604/
我正在为我的应用程序使用 Tank-Auth。我唯一的问题是激活和重置帐户密码。 用于登录、注册、注销;我对这些代码没有问题; $route['login'] = "/auth/login"; $ro
我是一名优秀的程序员,十分优秀!