gpt4 book ai didi

c++ - for循环优化c++

转载 作者:太空宇宙 更新时间:2023-11-04 16:20:45 25 4
gpt4 key购买 nike

这是我第一次在这个网站上发帖,我希望能得到一些帮助/提示。我有一项任务需要优化内部 for 循环的性能,但我不知道该怎么做。代码在作业中给出。我需要计算时间(我能够做到)并提高性能。

代码如下:

//header files

#define N_TIMES 200 //This is originally 200000 but changed it to test the program faster
#define ARRAY_SIZE 9973

int main (void) {
int *array = (int*)calloc(ARRAY_SIZE, sizeof(int));
int sum = 0;
int checksum = 0;
int i;
int j;
int x;

// Initialize the array with random values 0 to 13.
srand(time(NULL));
for (j=0; j < ARRAY_SIZE; j++) {
x = rand() / (int)(((unsigned)RAND_MAX + 1) / 14);
array[j] = x;
checksum += x;
}
//printf("Checksum is %d.\n",checksum);

for (i = 0; i < N_TIMES; i++) {
// Do not alter anything above this line.
// Need to optimize this for loop----------------------------------------
for (j=0; j < ARRAY_SIZE; j++) {
sum += array[j];
printf("Sum is now: %d\n",sum);
}


// Do not alter anything below this line.
// ---------------------------------------------------------------

// Check each iteration.
//
if (sum != checksum) {
printf("Checksum error!\n");
}
sum = 0;

}
return 0;
}

代码运行大约需要 695 秒。关于如何优化它有什么帮助吗?非常感谢。

最佳答案

那个循环的瓶颈显然是printf做的IO;由于您可能正在控制台上编写输出,因此输出是行缓冲的,这意味着每次迭代都会刷新 stdio 缓冲区,这会大大降低速度。

如果您必须完成所有打印,您可以通过强制流进行 block 缓冲来大大提高性能:在for 之前添加一个

setvbuf(stdout, NULL, _IOFBF, 0);

或者,如果这种方法被认为无效,你可以通过自己分配一个大缓冲区来做你自己的缓冲并做你自己的缓冲:使用 sprintf 写入你的缓冲区,定期清空它在带有 fwrite 的输出流中。

此外,您可以使用穷人的缓冲方法 - 只需使用一个足够大的缓冲区来写入所有这些东西(您可以很容易地计算出它必须有多大)并写入其中而不必担心它何时满,何时清空它,... - 在循环结束时清空它。 编辑:请参阅@paxdiablo 的回答以获取此示例


仅应用第一个优化,我用time得到的是

real    0m6.580s
user 0m0.236s
sys 0m2.400s

对比原版

real    0m8.451s
user 0m0.700s
sys 0m3.156s

因此,我们实时下降了约 3 秒,用户时间下降了半秒,系统时间下降了约 0.7 秒。但是在这里我们可以看到user+sys和real的巨大区别,也就是说时间不是花在进程内部做某事上,而是在等待。

因此,这里真正的瓶颈不在我们的进程,而是在虚拟终端模拟器的进程:向控制台发送大量文本无论如何都会变慢我们在程序中做了哪些优化;换句话说,您的任务不受 CPU 限制,而是受 IO 限制,因此针对 CPU 的优化不会有太大好处,因为最后您无论如何都必须等待 IO 设备完成他的慢动作。

加速此类程序的真正方法会简单得多:避免使用慢速 IO 设备(控制台),只需将数据写入文件(顺便说一句,默认情况下是 block 缓冲的)。

matteo@teokubuntu:~/cpp/test$ time ./a.out > test

real 0m0.369s
user 0m0.240s
sys 0m0.068s

关于c++ - for循环优化c++,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17035816/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com