c++ - 为什么这个浮点运算编译得如此奇怪(没有优化)？-6ren

c++ - 为什么这个浮点运算编译得如此奇怪(没有优化)？

转载作者：行者123 更新时间：2023-11-30 05:45:22

24

4

我使用 0 级和 3 级优化编译了以下函数g++ 版本 4.7.2 20120921:

double function1(double a, double b)
{
  return (a+b)*(a+b);
}

0级优化版本的反汇编提供:

0000000000000000 <_Z9function1dd>:
   0:   55                      push   rbp
   1:   48 89 e5                mov    rbp,rsp
   4:   f2 0f 11 45 f8          movsd  QWORD PTR [rbp-0x8],xmm0
   9:   f2 0f 11 4d f0          movsd  QWORD PTR [rbp-0x10],xmm1
   e:   f2 0f 10 45 f8          movsd  xmm0,QWORD PTR [rbp-0x8]
  13:   66 0f 28 c8             movapd xmm1,xmm0
  17:   f2 0f 58 4d f0          addsd  xmm1,QWORD PTR [rbp-0x10]
  1c:   f2 0f 10 45 f8          movsd  xmm0,QWORD PTR [rbp-0x8]
  21:   f2 0f 58 45 f0          addsd  xmm0,QWORD PTR [rbp-0x10]
  26:   f2 0f 59 c1             mulsd  xmm0,xmm1
  2a:   f2 0f 11 45 e8          movsd  QWORD PTR [rbp-0x18],xmm0
  2f:   48 8b 45 e8             mov    rax,QWORD PTR [rbp-0x18]
  33:   48 89 45 e8             mov    QWORD PTR [rbp-0x18],rax
  37:   f2 0f 10 45 e8          movsd  xmm0,QWORD PTR [rbp-0x18]
  3c:   5d                      pop    rbp
  3d:   c3                      ret

3 级优化提供:

0000000000000000 <_Z9function1dd>:
   0:   f2 0f 58 c1             addsd  xmm0,xmm1
   4:   f2 0f 59 c0             mulsd  xmm0,xmm0
   8:   c3                      ret

在未优化的版本中，为什么代码做了这么多额外的工作？具体来说，是什么导致了 mulsd 之后的 4 条指令？他们所做的只是将xmm0 移动到内存，从内存到rax 然后返回内存，然后返回到xmm0。

最佳答案

这是编译器认为它在做什么的一种可能 View 。非优化编译器对事物采取非常局部的观点。它不会展望下一步要做什么。它可能正在使用一组非常有限的操作。例如，它似乎将其某些工作传输限制在堆栈和 xmm0 之间，或堆栈和 rax 之间。

放之四海而皆准的方法的另一个方面是，如果在某些情况下需要做某事，它往往会一直完成。特别是，某些函数需要足够的寄存器来要求将参数和中间结果保存到堆栈中。优化编译器只会在必要时这样做。非优化编译器无条件地执行它。

0000000000000000 <_Z9function1dd>:
// Push the stack
   0:   55                      push   rbp
   1:   48 89 e5                mov    rbp,rsp
// Save the parameters to stack temporaries
   4:   f2 0f 11 45 f8          movsd  QWORD PTR [rbp-0x8],xmm0
   9:   f2 0f 11 4d f0          movsd  QWORD PTR [rbp-0x10],xmm1
// Load the temporary representing a into register xmm1, via xmm0
   e:   f2 0f 10 45 f8          movsd  xmm0,QWORD PTR [rbp-0x8]
  13:   66 0f 28 c8             movapd xmm1,xmm0
// Add the temporary representing b leaving (a+b) in xmm1
  17:   f2 0f 58 4d f0          addsd  xmm1,QWORD PTR [rbp-0x10]
// Load the temporary representing a into xmm0
  1c:   f2 0f 10 45 f8          movsd  xmm0,QWORD PTR [rbp-0x8]
// Add the temporary representing b, leaving (a+b) in xmm0
  21:   f2 0f 58 45 f0          addsd  xmm0,QWORD PTR [rbp-0x10]
// Multiply (a+b)*(a+b)
  26:   f2 0f 59 c1             mulsd  xmm0,xmm1
// Store the multiply result in a stack temporary
  2a:   f2 0f 11 45 e8          movsd  QWORD PTR [rbp-0x18],xmm0
// Load the return value into rax
  2f:   48 8b 45 e8             mov    rax,QWORD PTR [rbp-0x18]
// Move the return value to xmm0 via a stack temporary
  33:   48 89 45 e8             mov    QWORD PTR [rbp-0x18],rax
  37:   f2 0f 10 45 e8          movsd  xmm0,QWORD PTR [rbp-0x18]
// and return
  3c:   5d                      pop    rbp
  3d:   c3                      ret

关于c++ - 为什么这个浮点运算编译得如此奇怪(没有优化)？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29403532/

24

4

0

文章推荐： c++ - c++项目中函数的多重定义

文章推荐： java - MIDI 乐器不适用于 javax.sound.midi.MidiChannel

文章推荐： java - 卡夫卡 : disable create topic from Java

文章推荐： c++ - boost::flyweight 不适用于类

javascript - 谷歌地图自动完成弹回已经清除的文本......奇怪......奇怪......奇怪
我有这种来自 Google map 自动完成的奇怪行为(或者我可能错过了某事)...想法？奇怪的: 您在输入中输入某物，例如“伦敦” 您按 [ENTER] 你按下 [CLEAR] 按钮你点击进入'输
Java意外类型做字符串比较，奇怪
这段代码与《Learning Java》(Oracle Press Books)一书中的代码完全一样，但它不起作用。我不明白为什么它不起作用，它应该起作用。我用 OpenJDK 和 Sun JDK 7
Powershell 对新行使用反引号 - 奇怪
示例 1 中究竟发生了什么？这是如何解析的？ # doesnt split on , [String]::Join(",",("aaaaa,aaaaa,aaaaa,aaaaa,aaaaa,aa
iphone - 指针类型不兼容？？奇怪
我需要获得方程式系统的解决方案。为此，我使用函数sgesv_()。一切都很好，它使我感到解决方案的正确结果。但是我得到一个奇怪的警告。警告:从不兼容的指针类型传递'sgesv_'的参数3 我正在
ios - 奇怪!动画完成后是否一直调用函数？
我目前在制作动画时遇到一个奇怪的问题: [UIView animateWithDuration:3 delay:0
jQuery 不工作 - 奇怪
alert('works'); $(window).load(function () { alert('does not work'); });
java - 静态内部类 - 奇怪
我的代码: public class MyTest { public class StringSorter implements Comparator { public
JavaScript 对象更新行为(奇怪？)
我正在学习 JavaScript。尝试理解代码， function foo (){ var a = b = {name: 'Hai'}; document.write(a.name +''
c++ - GetLastError() != 奇怪
这个问题不太可能帮助任何 future 的访问者；它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关，这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用，visit
Linux 环境 -i 奇怪
这按预期工作: [dgorur@ted ~]$ env -i env [dgorur@ted ~]$ 这样做: [dgorur@ted ~]$ env -i which date which: no
c++ - 指针增量 - 奇怪
struct BLA { int size_; int size()const{ return size_; } } int x; BLA b[ 2 ]; BLA * p = &b[
css - 图像垂直对齐与 css - 奇怪
我有以下代码: #test img {vertical-align: middle;} div#test { border: 1px solid green; height: 150px; li
gcc - (奇怪？)GCC 预处理器行为
我想大多数使用过 C/C++ 的人都对预处理器的工作原理有一定的直觉(或多或少)。直到今天我也是这么认为的，但事实证明我的直觉是错误的。故事是这样的: 今天我尝试了一些东西，但我无法解释结果。首先考虑
OCMock只生效一次，奇怪，为什么？或者我这边有什么问题？
我想为 TnSettings 做 mock，是的，如果通过以下方法编写代码，它就可以工作，问题是我们需要为每个案例编写 mock 代码，如果我们只 mock 一次然后执行多个案例，那么第二个将报告异常
c - 溢出？找不到来源，奇怪
我的项目中有以下两个结构 typedef volatile struct { unsigned char rx_buf[MAX_UART_BUF]; //Input buffer over U
c# - 奇怪，regex.split方法匹配一个null元素
Regex rx = new Regex(@"[+-]"); string[] substrings = rx.Split(expression); expression = "-9a3dcb
java - JDBC 连接被对等方关闭(奇怪)
我的两个应用程序遇到了一个奇怪的问题。这是设置: 两个 tomcat/java 应用程序，在同一个网络中运行，连接到相同的 MS-SQL-Server。一个应用程序，恰好按顺序位于 DMZ 中可从互联
Android OnLongClickListener 奇怪/不可靠的行为
我目前正在与 Android Api Lvl 8 上的 OnLongClickListener 作斗争。拿这段代码: this.webView.setOnLongClickListener(new
java - JUnit 奇怪 - 我未指定预期数量
这个问题不太可能帮助任何 future 的访问者；它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况相关，这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用，visit
objective-c - performSelectorOnMainThread 奇怪
只是遇到了奇怪的事情。我有以下代码: -(void)ImageDownloadCompleat { [self performSelectorOnMainThread:@selector(up

首页

博学

6Ren·AI

商城

c++ - 为什么这个浮点运算编译得如此奇怪(没有优化)？