gpt4 book ai didi

c++ - 速度比较 : add zero or check non-zero first

转载 作者:搜寻专家 更新时间:2023-10-31 00:07:13 27 4
gpt4 key购买 nike

我正在优化我正在编写的程序中最耗时的循环,该循环对数组中的许多条目求和,其中许多条目将为零。在添加之前检查条目是否为零或跳过检查并添加所有条目是否更快?下面每一个的例子。这是在 C++ 中。谢谢!

double *arr, sum=0;
...
for (int i = 0; i < n; i++)
sum += arr[i];

double *arr, sum=0;
...
for (int i = 0; i < n; i++)
if (arr[i])
sum += arr[i];

最佳答案

今日名言:

Premature optimization is the root of all evil
- Donald Knuth

如果您的意图是添加一个数组的所有元素,那么请编写执行此操作的代码,并让编译器的优化器处理最好的。所以选择第一种选择;你的 future 有一天你会心存感激。

如果不是绝对必要,不要进行手动优化:

对于现代 CPU,无论如何都很难想到缓存管理、缓存优化、跳转预测和其他硬件技巧的所有可能影响。编译器的优化器可以结合比我们更多的因素。

如果您真的注意到一些性能问题,那么分析您的代码,并将您的精力集中在真正重要的优化上。或者,您可以在目标平台上对代码进行基准测试,但要注意基准测试中的细微差异,这可能会影响优化器。

现在,话虽这么说,第二个选项需要对数组中的每一项进行比较指令(x86 上的 ucomisd)。因此,如果大多数项目都具有非零值,那么您通常会增加不必要的开销。对于 null 项目,您可以用两条指令交换一个简单的添加,一条比较和一条条件分支。我不确定这是否真的更快,但如果有任何好处,那很可能是非常微不足道的。因此,在最好的情况下,您可以获得非常小的 yield ,但很可能会增加一些开销。所以直觉上,坚持第一个选择,除非你的探查器告诉你有问题。

关于c++ - 速度比较 : add zero or check non-zero first,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54611552/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com