- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个简单的 program :
int main()
{
return 2*7;
}
打开优化的 GCC 和 clang 都能愉快地生成 2 个指令二进制文件,但 icc 给出了奇怪的输出。
push rbp #2.1
mov rbp, rsp #2.1
and rsp, -128 #2.1
sub rsp, 128 #2.1
xor esi, esi #2.1
mov edi, 3 #2.1
call __intel_new_feature_proc_init #2.1
stmxcsr DWORD PTR [rsp] #2.1
mov eax, 14 #3.12
or DWORD PTR [rsp], 32832 #2.1
ldmxcsr DWORD PTR [rsp] #2.1
mov rsp, rbp #3.12
pop rbp #3.12
ret
最佳答案
我不知道为什么ICC选择按2个缓存行对齐堆栈:
and rsp, -128 #2.1
sub rsp, 128 #2.1
这很有趣。 L2 缓存有一个相邻行预取器,它喜欢将成对的行(在 128 字节对齐的组中)拉入 L2。但是 main 的堆栈框架通常不会被大量使用。也许在某些程序中重要的变量被分配在那里。 (这也解释了设置 rbp
以保存旧的 RSP,以便它可以在 ANDing 之后返回。gcc 在函数中使用 RBP 来对齐堆栈。)
剩下的就是因为main()
是特殊的,ICC 启用 -ffast-math
默认情况下。 (这是英特尔的“肮脏”小 secret 之一,让它开箱即用地自动矢量化更多浮点代码。)
这包括将代码添加到 main
的顶部设置 MXCSR(SSE 状态/控制寄存器)中的 DAZ/FTZ 位。有关这些位的更多信息,请参阅 Intel 的 x86 手册,但它们实际上并不复杂:
DAZ:非正规数为零:作为 SSE/AVX 指令的输入,非正规数被视为零。
FTZ:清零:舍入 SSE/AVX 指令的结果时,次正规结果清零。
相关:SSE "denormals are zeros" option
(ISO C++ 禁止程序回调 main()
,因此允许编译器将运行一次的内容放在 main
本身而不是 CRT 启动文件中。gcc/clang 与-ffast-math
指定用于设置 MXCSR 的 CRT 启动文件中的链接链接。但是当使用 gcc/clang 编译时,它只影响允许优化的代码生成。即,当不同的临时文件时,将 FP add/mul 视为关联的意味着它真的不是。这与设置 DAZ/FTZ 完全无关)。
非正规在这里被用作次正规的同义词:具有最小指数和尾数的 FP 值,其中隐含的前导位是 0 而不是 1。即,一个幅度小于 FLT_MIN
or DBL_MIN
的值。 ,最小的可表示标准化 float / double 。
https://en.wikipedia.org/wiki/Denormal_number .
产生次正常结果的指令可能很多慢:为了优化延迟,一些硬件中的快速路径假设结果是规范化的,如果结果不能规范化则采用微码辅助。使用 perf stat -e fp_assist.any
计算此类事件。
来自 Bruce Dawson 的优秀 FP 文章系列:That’s Not Normal–the Performance of Odd Floats 。还有:
Agner Fog 做了一些测试(参见他的 microarch pdf ),并为 Haswell/Broadwell 报告:
Underflow and subnormals
Subnormal numbers occur when floating point operations are close tounderflow. The handling of subnormal numbers is very costly in somecases because the subnormal results are handled by microcodeexceptions.
The Haswell and Broadwell have a penalty of approximately 124 clockcycles in all cases where an operation on normal numbers gives asubnormal result. There is a similar penalty for a multiplicationbetween a normal and a subnormal number, regardless of whether theresult is normal or subnormal. There is no penalty for adding a normaland a subnormal number, regardless of the result. There is no penaltyfor overflow, underflow, infinity or not- a-number results.
The penalties for subnormal numbers are avoided if the "flush-to-zero"mode and the "denormals-are-zero" mode are both set in the MXCSRregister.
所以在某些情况下,现代 Intel CPU 即使在次正规情况下也能避免惩罚,但是
关于c++ - 为什么 icc 会为一个简单的 main 生成奇怪的程序集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52141947/
因此,当使用“智能”时,当我想创建一个类时,它还会创建另外两个函数(不确定我是否正确调用了它们): class main { private: /* data */ public: m
我确实知道 C/C++ 和 Java 中使用的 main() 方法,但由于 main() 是用户定义的(因为 main() 中的代码是由用户定义的,它不能是预定义的方法) & 在 C/C++ 中,ma
这个问题在这里已经有了答案: What is a NullPointerException, and how do I fix it? (12 个答案) 关闭 7 年前。 我意识到这是一个常见错误,
您好,我是 jquery 和 javascript 的新手。我想做的是我有 3 个独立的 Main-Divs ex main-div1, main-div2, main-div-3 它们都是一个大盒子
我知道以前曾有人问过有关此错误的问题,但我的情况与其他人不同。我正在编写计算数据集的平均值、方差和标准差的代码。编译代码时我没有收到任何错误,但是当我尝试运行代码时,我收到如下错误: Exceptio
这个问题已经有答案了: What should main() return in C and C++? (19 个回答) Why is the type of the main function in
无效的输入流不起作用 - 每次我给出负的月份值时,它都会返回此异常。 代码: import java.util.Scanner; public class Main { public stat
我在 main() 中调用 main(),递归 10 次。现在,在使用 gdb (bt/backtrace) 进行调试时,我没有看到 main() 的多个帧。为什么? #include int mai
我有一个类 - A - 没有方法,只有主要方法。 在其他类(class) - B - 我需要调用那个 main.做什么最好?从使用的资源、时间和功耗以及效率来看? 从类 A 创建一个“a”对象并执行
鉴于 documentation以及对 earlier question 的评论,根据要求,我制作了一个最小的可重现示例,演示了这两个语句之间的区别: my %*SUB-MAIN-OPTS = :na
我有一个在 main 中声明并初始化的数组,名为 Edges。 我还在 main 中声明了一些访问名为 Edges 的数组的函数。 代码编译并运行。 为什么它有效?我认为 main 中声明的变量不是全
如果定义内容主要部分的最具语义性和可访问性的方式是标准,那么使用 ARIA 地标似乎是多余的元素。正在添加 role="main"到元素真的有必要吗? 最佳答案 并非所有现代浏览器都已经映射了 ari
我是 C 语言的新手(6 小时前开始),我知道有大量的在线引用资料,我应该(并且将会)详细查看,但现在,我有紧急情况需要帮助。我有一个包含以下文件的项目文件夹: boundary_val.c boun
我正在审查许多不同的 Java 程序,并试图弄清楚如何只更新一次而不是两次更新对程序名称的引用。有没有办法在单个终端命令中使用变量? :S 我试图改进的命令是这样的形式: javac Main.jav
我已经创建了一个工作线程, Thread thread= new Thread(runnable); thread.start(); 我在工作线程中打印这个; Log.d("SessionTh
import java.awt.*; import java.awt.event.*; import java.io.*; import java.lang.*; public class Main
这是我的 Main.java,它位于服务器套接字“get().logger().tag();”之后的部分我已经在实例中添加了所有这些,我真的不确定它出了什么问题。 public class Main
我在 http://www.hackerearth.com/problem/algorithm/roys-life-cycle/ 上测试了我的程序。但是,我总是收到错误:在类 ActivityTime
我想要一个脚本来运行从模块导出的子例程,导出的子程序在脚本中作为 MAIN 运行。该子例程做了我想做的所有事情,除了它返回结果而不是打印它。 RUN-MAIN 似乎实现了我的大部分目标,但我不确定如何
java中有什么具体原因吗,main方法应该是小写字母 是的“主要”和“主要” 编译完成 public class ManiMethod { public static void main(S
我是一名优秀的程序员,十分优秀!