gpt4 book ai didi

c - 双倍性能比 C 中的 float 快得多

转载 作者:行者123 更新时间:2023-12-02 04:46:37 26 4
gpt4 key购买 nike

我试图弄清楚在 C 语言的某些代码中使用 float 是否足以满足我的需要,但在搜索之后并没有真正理解如何将精度位转换为实际数字,我决定只写一些代码对于我的测试用例,看看结果是什么。

float 看起来足够精确,但令我感到惊讶的是, float 在我的 17 4700hq haswell 处理器(Windows 8.1 x64、C、MSVS v120)上运行时间要长大约 70%。我本来希望运行时间相似或 float 更快。但显然不是。所以我关闭了所有的优化,还是一样。在 debug 版本上试了一下,还是一样的性能问题。 AVX2 和 SSE 3,都显示了这个。

双人跑大约需要 197 秒,漂浮需要 343 秒。

我浏览了英特尔® 64 位和 IA-32 架构软件开发人员手册,但考虑到它的篇幅和我缺乏专业知识,我还没有从中收集到任何关于此的答案。然后我看了看两者的拆解,但我没有注意到我未经训练的眼睛有任何明显的差异。

所以,有人知道为什么会这样吗?这是我使用的代码,唯一的变化是除了 anError 变量之外的所有变量都从 double 变为 float 。

#include <errno.h>
#include <math.h>
#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>
#include <string.h>
#include <time.h>
#include <sys/types.h>
#include <omp.h>



int main( void ) {

clock_t start = clock() ;

// body of a candle
double open = 0.500000 ;
double close = 0.500001 ;
double end = 1 ;

uint64_t resultCounter = 0 ;
double anError = 0 ;

while (open < end){
while(close < end){
//calc # times result is postive. Should be 0.
double res = open - close ;
if (res > 0 ) {
resultCounter++ ;
if (anError < fabs( res )) { anError = res ; }
}
close = close + 0.000001 ;
}
open = open + 0.000001 ;
close = open + .000001 ;
}

clock_t finish = clock() ;
double duration = ((double) (finish - start)) / CLOCKS_PER_SEC;
double iterations = (((end - .50000) / .000001) * ((end - .50000) / .000001)) ;
fprintf( stdout, "\nTotal processing time was %f seconds.\n", duration ) ;
fprintf( stdout, "Error is %f. Number of times results were incorrect %llu out of %f iterations.\n",
anError, resultCounter, iterations ) ;

return 0 ;
}

编辑:数字末尾缺少 f 似乎是原因(感谢 Joachim!)。显然,没有 f 后缀的 float 常量实际上是 double! C的另一个怪癖就是喜欢咬无知的屁股。不确定这种奇怪现象背后的基本原理是什么,但耸耸肩。如果有人想为此写一个好的答案以便我可以接受,请随意。

最佳答案

根据 C 标准:

An unsuffixed floating constant has type double. If suffix is the letter f or F, the floating constant has type float. If suffix is the letter l or L, the floating constant has type long double

有关浮点常量的更多详细信息 here .所以:

num 只是一个 float

float num = 1.0f;
float num = 1.0F;

double 被转换为 float 并存储在 num 中

float num = 1.0;

一个 float 被转换为 double 并存储在 num 中

double num = 1.0f;
double num = 1.0F;

由于常量从 double 到 float 的转换涉及复制内存,因此使用 float 时性能更差。

关于c - 双倍性能比 C 中的 float 快得多,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32406047/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com