gpt4 book ai didi

c++ - Linux 中的可执行文件会影响链接动态库中的浮点精度吗?

转载 作者:IT王子 更新时间:2023-10-29 00:40:38 40 4
gpt4 key购买 nike

我们在动态库中遇到浮点精度问题。

设置如下:

  • 我们有一个动态库,它对大量 float 执行计算 X。 X由很多浮点运算组成。
  • 我们将这个动态库链接到两个可执行文件:A 和 B。
  • 在库中,我们打印计算 X 的输入。
  • 对于运行的可执行文件 A 和 B,报告完全相同的输入(最多 DBL_DIG 小数位)。
  • 然而,对于可执行文件 A 和可执行文件 B,计算 X 的输出是不同的。

可执行文件和库都是用 C++ 编写的,并在同一台机器上使用相同的 GCC 编译器版本编译。该库仅使用与可执行文件 A 相同的编译器设置编译一次,但可执行文件 B 的编译器设置可能不同。

由于使用相同的库,我们期望在提供相同输入时两个可执行文件具有相同的计算精度。看起来库的浮点精度受外部因素的影响,例如处理特定配置。

这是否可能?如果可能,如何确保我们在两次运行(程序 A 和 B)中获得相同的精度?

编辑 1

我成功地创建了一个演示差异的最小示例。如果我在库中使用以下代码(比如计算 X),两次运行(A 和 B)的结果都不同:

float* value = new float;
*value = 2857.0f;
std::cout << std::setprecision(15) << std::log(*value) << std::endl;

我还以二进制格式打印了 float ,它们在最后一位显示了差异。

不幸的是,无法控制可执行文件 A 的整个构建链。实际上,A 又是一个动态库,它是从另一个我无法控制也不知道编译器选项的可执行文件中使用的。

我尝试在可执行文件 B 上使用许多不同的优化编译器选项,以查看是否可以获得与可执行文件 A 相同的结果,但直到现在这并没有解决问题。

编辑2

上面代码的汇编器输出是:

.LFB1066:
.cfi_startproc
.cfi_personality 0x9b,DW.ref.__gxx_personality_v0
push rbp #
.cfi_def_cfa_offset 16
.cfi_offset 6, -16
push rbx #
.cfi_def_cfa_offset 24
.cfi_offset 3, -24
sub rsp, 8 #,
.cfi_def_cfa_offset 32
mov edi, 4 #,
call _Znwm@PLT #
mov DWORD PTR [rax], 0x45329000 #* D.23338,
mov rdi, QWORD PTR _ZSt4cout@GOTPCREL[rip] # tmp66,
mov rax, QWORD PTR [rdi] # cout._vptr.basic_ostream, cout._vptr.basic_ostream
mov rax, QWORD PTR -24[rax] # tmp68,
mov QWORD PTR 8[rax+rdi], 15 # <variable>._M_precision,
movsd xmm0, QWORD PTR .LC1[rip] #,
call _ZNSo9_M_insertIdEERSoT_@PLT #
mov rbx, rax # D.23465,
mov rax, QWORD PTR [rax] # <variable>._vptr.basic_ostream, <variable>._vptr.basic_ostream
mov rax, QWORD PTR -24[rax] # tmp73,
mov rbp, QWORD PTR 240[rbx+rax] # D.23552, <variable>._M_ctype
test rbp, rbp # D.23552
je .L9 #,
cmp BYTE PTR 56[rbp], 0 # <variable>._M_widen_ok
je .L5 #,
movsx esi, BYTE PTR 67[rbp] # D.23550, <variable>._M_widen

编辑3

按照评论中的建议,我在库中打印了浮点舍入模式和 SSE 状态信息。

对于两次运行(可执行文件 A 和 B),我得到相同的值:

  • 舍入模式:895
  • 上交所状态:8114

最佳答案

您的问题的答案是:是的,原则上,进程可以更改您的代码在其中运行的浮点上下文


关于您的特定代码和值:

舍入模式(如 Matteo 所建议的)可能影响字符串格式,因为它重复除以 10 - 但我无法使用 std::fesetround 重现该问题。

我也看不出它会如何真正影响你所说的不同的位模式。汇编代码显示文字0x45329000,相当于2857.0,文字本身不能被浮点env改变。

关于c++ - Linux 中的可执行文件会影响链接动态库中的浮点精度吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30875849/

40 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com