作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
一两年前,编写数字代码以避免使用乘法和除法而使用加法和减法是值得的。一个很好的例子是使用 forward differences计算多项式曲线而不是直接计算多项式。
情况仍然如此,还是现代计算机体系结构已经发展到 *,/不再比 +,- 慢很多倍的地步?
具体来说,我对在具有大量板载浮点硬件的现代典型 x86 芯片上运行的已编译 C/C++ 代码感兴趣,而不是试图在软件中执行 FP 的小型微型计算机。我意识到流水线和其他架构增强功能排除了特定的周期计数,但我仍然想获得有用的直觉。
最佳答案
它还取决于指令组合。您的处理器将有多个计算单元随时待命,如果所有计算单元一直被填满,您将获得最大吞吐量。因此,执行 mul 的循环与执行循环或添加一样快 - 但如果表达式变得更复杂,则相同。
例如,以这个循环为例:
for(int j=0;j<NUMITER;j++) {
for(int i=1;i<NUMEL;i++) {
bla += 2.1 + arr1[i] + arr2[i] + arr3[i] + arr4[i] ;
}
}
bla += 2.1 * arr1[i] + arr2[i] + arr3[i] * arr4[i] ;
bla += 2.1 + arr1[i] * arr2[i] + arr3[i] * arr4[i] ;
bla += someval + arr1[i] * arr2[i] + arr3[i] * arr4[i] ; /*someval == 2.1*/
bla += someval + arr1[i] + arr2[i] + arr3[i] + arr4[i] ; /*someval == 2.1*/
bla += someval * arr1[i] * arr2[i] * arr3[i] * arr4[i] ; /*someval == 2.1*/
bla *= someval; // someval very near 1.0; takes 2.1 seconds
bla *= arr1[i] ;// arr1[i] all very near 1.0; takes 66(!) seconds
bla += someval + arr1[i] * arr2[i] + arr3[i] * arr4[i] ; // 1.6 seconds
bla += someval + arr1[i] * arr2[i] + arr3[i] * arr4[i] ; //32-bit mode, 2.2 seconds
bla += someval + arr1[i] * arr2[i] + arr3[i] * arr4[i] ; //32-bit mode, floats 2.2 seconds
bla += someval * arr1[i]* arr2[i];// 0.9 in x64, 1.6 in x86
bla += someval * arr1[i];// 0.55 in x64, 0.8 in x86
bla += arr1[i] * arr2[i];// 0.8 in x64, 0.8 in x86, 0.95 in CLR+x64, 0.8 in CLR+x86
关于floating-point - 浮点加法与浮点乘法的相对速度是多少,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1146455/
我是一名优秀的程序员,十分优秀!