gpt4 book ai didi

linux - 有什么方法可以确保浮点运算结果在 linux 和 windows 中相同

转载 作者:IT王子 更新时间:2023-10-29 01:13:55 26 4
gpt4 key购买 nike

我的程序在 linux 和 windows 上都运行,我必须确保浮点运算在不同的操作系统上得到相同的结果。

代码如下:

for (int i = 0; i < 100000; ++i)
{
float d_value = 10.0f / float(i);
float p_value = 0.01f * float(i) + 100.0f;
}

我使用“g++ -m32 -c -static -g -O0 -ffloat-store”在 Linux 中构建代码。我使用“/fp:precise/O2”在 windows 中使用 vs2005 构建代码。

当我打印“d_value”和“p_value”时,“d_value”在 linux 和 windows 中都是一样的。但是“p_value”有时是不同的。对于示例,以十六进制格式打印“p_value”:

windows:  42d5d1eb
linux: 42d5d1ec

为什么会发生这种情况?

我的g++版本是

Configured with: ../src/configure -v --with-pkgversion='Debian 4.4.5-8' --with-bugurl=file:///usr/share/doc/gcc-4.4/README.Bugs --enable-languages=c,c++,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-4.4 --enable-shared --enable-multiarch --enable-linker-build-id --with-system-zlib --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --with-gxx-include-dir=/usr/include/c++/4.4 --libdir=/usr/lib --enable-nls --enable-clocale=gnu --enable-libstdcxx-debug --enable-objc-gc --enable-targets=all --with-arch-32=i586 --with-tune=generic --enable-checking=release --build=i486-linux-gnu --host=i486-linux-gnu --target=i486-linux-gnu
Thread model: posix
gcc version 4.4.5 (Debian 4.4.5-8)

我使用标志 -ffloat-store,因为这里有人建议:Different math rounding behaviour between Linux, Mac OS X and Windows

最佳答案

在 Windows 上使用 /fp:strict 告诉编译器生成严格遵循 IEEE 754 的代码,在 Linux 上使用 gcc -msse2 -mfpmath=sse 来获取那里的行为相同。

您所看到的差异的原因已在 StackOverflow 上的一些地方进行了讨论,但最好的调查是 David Monniaux 的 article .


我用gcc -msse2 -mpfmath=sse编译得到的汇编指令如下。指令 cvtsi2ssqdivssmulssaddss 是正确的使用指令,它们生成一个程序,其中p_value 在某一点包含 42d5d1ec

    .globl  _main
.align 4, 0x90
_main: ## @main
.cfi_startproc
## BB#0:
pushq %rbp
Ltmp2:
.cfi_def_cfa_offset 16
Ltmp3:
.cfi_offset %rbp, -16
movq %rsp, %rbp
Ltmp4:
.cfi_def_cfa_register %rbp
subq $32, %rsp
movl $0, -4(%rbp)
movl $0, -8(%rbp)
LBB0_1: ## =>This Inner Loop Header: Depth=1
cmpl $100000, -8(%rbp) ## imm = 0x186A0
jge LBB0_4
## BB#2: ## in Loop: Header=BB0_1 Depth=1
movq _p_value@GOTPCREL(%rip), %rax
movabsq $100, %rcx
cvtsi2ssq %rcx, %xmm0
movss LCPI0_0(%rip), %xmm1
movabsq $10, %rcx
cvtsi2ssq %rcx, %xmm2
cvtsi2ss -8(%rbp), %xmm3
divss %xmm3, %xmm2
movss %xmm2, -12(%rbp)
cvtsi2ss -8(%rbp), %xmm2
mulss %xmm2, %xmm1
addss %xmm0, %xmm1
movss %xmm1, (%rax)
movl (%rax), %edx
movl %edx, -16(%rbp)
leaq L_.str(%rip), %rdi
movl -16(%rbp), %esi
movb $0, %al
callq _printf
movl %eax, -20(%rbp) ## 4-byte Spill
## BB#3: ## in Loop: Header=BB0_1 Depth=1
movl -8(%rbp), %eax
addl $1, %eax
movl %eax, -8(%rbp)
jmp LBB0_1
LBB0_4:
movl -4(%rbp), %eax
addq $32, %rsp
popq %rbp
ret

关于linux - 有什么方法可以确保浮点运算结果在 linux 和 windows 中相同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16395615/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com