gpt4 book ai didi

gcc - MSYS2 GCC 在禁用 SSE 的情况下将浮点运算的双倍归零

转载 作者:行者123 更新时间:2023-12-04 14:30:30 25 4
gpt4 key购买 nike

考虑下面的 C 程序。

#include <stdio.h>
#include <stdlib.h>

int main(int argc, char* argv[]) {
double x = 4.5;
double x2 = atof("3.5");
printf("%.6f\n", x);
printf("%.6f\n", x2);
return 0;
}

当使用通过 MSYS2 可用的 GCC 版本编译它时,输出最终取决于 SSE 的可用性:
$ gcc test.c && ./a.exe
4.500000
3.500000

$ gcc -mno-sse test.c && ./a.exe
4.500000
0.000000

这种行为是否有意义,如果没有,在这种情况下有没有办法让 GCC 产生合理的结果(除了删除 -mno-sse 的简单解决方案之外)?下面是一些版本信息:
$ gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-pc-msys/7.3.0/lto-wrapper.exe
Target: x86_64-pc-msys
Configured with: /msys_scripts/gcc/src/gcc-7.3.0/configure --build=x86_64-pc-msys --prefix=/usr --libexecdir=/usr/lib --
enable-bootstrap --enable-shared --enable-shared-libgcc --enable-static --enable-version-specific-runtime-libs --with-ar
ch=x86-64 --with-tune=generic --disable-multilib --enable-__cxa_atexit --with-dwarf2 --enable-languages=c,c++,fortran,lt
o --enable-graphite --enable-threads=posix --enable-libatomic --enable-libcilkrts --enable-libgomp --enable-libitm --ena
ble-libquadmath --enable-libquadmath-support --disable-libssp --disable-win32-registry --disable-symvers --with-gnu-ld -
-with-gnu-as --disable-isl-version-check --enable-checking=release --without-libiconv-prefix --without-libintl-prefix --
with-system-zlib --enable-linker-build-id --with-default-libstdcxx-abi=gcc4-compatible
Thread model: posix
gcc version 7.3.0 (GCC)

这是反汇编的结果 main :
   0x0000000100401080 <+0>:     push   %rbp
0x0000000100401081 <+1>: mov %rsp,%rbp
0x0000000100401084 <+4>: sub $0x30,%rsp
0x0000000100401088 <+8>: mov %ecx,0x10(%rbp)
0x000000010040108b <+11>: mov %rdx,0x18(%rbp)
0x000000010040108f <+15>: callq 0x1004010f0 <__main>
0x0000000100401094 <+20>: fldl 0x1f76(%rip) # 0x100403010
0x000000010040109a <+26>: fstpl -0x8(%rbp)
0x000000010040109d <+29>: lea 0x1f5c(%rip),%rcx # 0x100403000
0x00000001004010a4 <+36>: callq 0x100401100 <atof>
0x00000001004010a9 <+41>: mov %rax,-0x10(%rbp)
0x00000001004010ad <+45>: mov -0x8(%rbp),%rax
0x00000001004010b1 <+49>: mov %rax,%rdx
0x00000001004010b4 <+52>: lea 0x1f49(%rip),%rcx # 0x100403004
0x00000001004010bb <+59>: callq 0x100401110 <printf>
0x00000001004010c0 <+64>: mov -0x10(%rbp),%rax
0x00000001004010c4 <+68>: mov %rax,%rdx
0x00000001004010c7 <+71>: lea 0x1f36(%rip),%rcx # 0x100403004
0x00000001004010ce <+78>: callq 0x100401110 <printf>
0x00000001004010d3 <+83>: mov $0x0,%eax
0x00000001004010d8 <+88>: add $0x30,%rsp
0x00000001004010dc <+92>: pop %rbp
0x00000001004010dd <+93>: retq
0x00000001004010de <+94>: nop
0x00000001004010df <+95>: nop

值得注意的是,尝试在 Linux 版本的 GCC 上编译相同的程序会产生错误(原因在 this question 中讨论):
$ gcc -mno-sse test2.c
test2.c: In function ‘main’:
test2.c:6:12: error: SSE register return with SSE disabled
double x2 = atof("3.5");
^~

$ gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/6/lto-wrapper
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Debian 6.3.0-18+deb9u1' --with-bugurl=file:///usr/share/doc/gcc-
6/README.Bugs --enable-languages=c,ada,c++,java,go,d,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-6 --program-pr
efix=x86_64-linux-gnu- --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enabl
e-threads=posix --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-l
ibstdcxx-time=yes --with-default-libstdcxx-abi=new --enable-gnu-unique-object --disable-vtable-verify --enable-libmpx --
enable-plugin --enable-default-pie --with-system-zlib --disable-browser-plugin --enable-java-awt=gtk --enable-gtk-cairo
--with-java-home=/usr/lib/jvm/java-1.5.0-gcj-6-amd64/jre --enable-java-home --with-jvm-root-dir=/usr/lib/jvm/java-1.5.0-
gcj-6-amd64 --with-jvm-jar-dir=/usr/lib/jvm-exports/java-1.5.0-gcj-6-amd64 --with-arch-directory=amd64 --with-ecj-jar=/u
sr/share/java/eclipse-ecj.jar --with-target-system-zlib --enable-objc-gc=auto --enable-multiarch --with-arch-32=i686 --w
ith-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-checking=release --build=x8
6_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 6.3.0 20170516 (Debian 6.3.0-18+deb9u1)

最佳答案

你应该从 msys gcc -mno-sse 得到同样的错误.标准调用约定(x64 Windows __fastcall)使用 xmm0..3(SSE 向量寄存器)传递和返回 floatdouble .

来自 asm main你显示,看来-mno-sse将 gcc 的调用约定的想法更改为传递/返回 double在整数寄存器中,例如 ARM 上的软浮点数。所以有一个调用约定不匹配,实际发生的事情取决于 asm 细节和机会。

Windows x64 调用约定有一个有趣的设计特性,它可以实现像 printf 这样的可变参数函数。更简单:当 调用可变参数函数,该插槽的整数和 XMM 寄存器都必须包含值 ( https://docs.microsoft.com/en-gb/cpp/build/varargs?view=vs-2017 )。因此,该函数可以将 rcx、rdx、r8 和 r9 转储到影子空间中,并在查看 args 以确定哪些是 FP 哪些是整数之前形成一个 8 字节 args 数组(与堆栈 args 相邻)。 (有关这样做的丑陋示例,请参阅 How to set function arguments in assembly during runtime in a 64bit application on Windows?。)与 x86-64 System V ABI 不同,第 2 个 arg 总体在 XMM1 中,而不是第 2 个 FP arg。所以只有 4 个 args 可以在 regs 中,即使有 FP 和整数的混合。

因此,gcc 传递了一个 double %rdx 中的位模式实际有效 , 因为这个库 printf只关心 %rdx 中的值,忽略 %xmm1 中的值.

但是atof在 XMM0 中返回,RAX 持有垃圾。您的 -mno-sse main使用保存 RAX 并将其传递给第二个 printf。它要么为零,要么很小 double .

如果 RAX 持有地址,则高 16 位将为零,因此将该位模式键入 IEEE double ( https://en.wikipedia.org/wiki/Double-precision_floating-point_format ) 为我们提供 exponent = 0,以及有效数的一些位。一个小的正整数会更小 double .

所以你可能打印了一个非常小的次正常 double舍入到 0以那种格式,它来自任何垃圾 atof当它返回 XMM0 中的值时,它留在 RAX 中。

关于gcc - MSYS2 GCC 在禁用 SSE 的情况下将浮点运算的双倍归零,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52649075/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com