- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我编写了以下代码来模拟和简化我的应用程序中发生的事情。
在这个简化中,我有 if 和 else 分支,它们执行相同的代码,但写入内存的不同部分。所以我想使用一个包含两个条目的数组,并根据语句条件更新第一个或第二个条目。
该解决方案带来了预期的速度提升。
但是当我们在执行期间对每次迭代进行随机访问时,改进几乎消失了。为了展示这种奇怪的行为,我使用模板来激活或停用 if 语句和随机访问的使用,即..
useif:使用if语句时为true,使用内存访问时为false。
rand_access:当我们对每次迭代进行随机访问时为真,否则为假。
#include <chrono>
#include <iostream>
#include <vector>
#include <numeric>
#include <algorithm>
#define N 1000000000
using namespace std;
using namespace std::chrono;
template <bool useif, bool rand_access>
void exec(vector<int>& V, vector<bool>& B) {
auto start = high_resolution_clock::now();
int sum[2], sum1 = 0, sum2 = 0;
sum[0] = 0; sum[1] = 0;
for ( int i = 0; i < N; i++ ) {
const int index = (rand_access) ? V[i] : i;
if ( useif ){
if ( B[index] ) sum2 += V[i];
else sum1 += V[i];
} else
sum[B[index]] += V[i];
}
auto t = std::chrono::duration_cast<milliseconds>(high_resolution_clock::now() - start);
std::cout << "Time useif="<<useif<<", rand_access="<<rand_access<<" : " << t.count() << " ms" << std::endl;
std::cout << (sum1+sum2+sum[0]+sum[1]) << std::endl;
}
int main() {
vector<int> V(N);
vector<bool> B(N, false);
iota( V.begin(), V.end(), 0 );
random_shuffle( V.begin(), V.end() );
fill( B.begin(), B.begin() + B.size()/2, true);
random_shuffle( B.begin(), B.end() );
exec<false, false>(V, B);
exec<false, true>(V, B);
exec<true, false>(V, B);
exec<true, true>(V, B);
return 0;
}
在我的机器上,使用 g++ --std=c++11 -O3 -march=native -mtune=native 编译,我得到以下结果:
时间 useif=0, rand_access=0 : 1518 毫秒
时间 useif=0, rand_access=1 : 10791 毫秒
时间 useif=1, rand_access=0 : 4384 毫秒
时间 useif=1, rand_access=1 : 12214 ms
因此,当NOT涉及随机访问时,用内存访问替换 if 语句的速度提高了 2.8,否则性能真的很差关闭(1.1 加速)。
我不明白为什么会发生这种情况以及我该如何处理它,即我如何优化 if 语句知道 if 和 else 分支正在执行相同的代码?
最佳答案
您使用数组优化 if
/else
是正确的。它总能给您带来改进,但改进的意义还取决于其他因素。
您的实验显示了分支消除和缓存访问优化的相对影响。
当代码按顺序访问内存时,由于引用的局部性,它会利用 CPU 缓存优化,仅“支付”其内存访问的一小部分。对于 64 字节缓存行,对于存储在连续位置的 4 字节整数,它就像一个令人难以置信的“买一送十五”政策。它可以让您的 CPU 继续添加,而无需等待来自内存的数据。
当代码没有分支时,它会利用 CPU 指令流水线。使用难以预测的条件触发 if
会使流水线停止,因此同时“运行”的指令更少。
从带分支的随机访问到带分支的顺序访问可为您节省 7.8 秒;除此之外,消除分支还能为您节省 2.8 秒。
相比之下,在没有顺序访问的情况下消除分支只会给您带来 1.5 秒的改进,因为当 CPU 无论如何都在等待内存时,消除流水线停顿变得不那么重要了。
关于C++ 优化 if/else 语句,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39815800/
创建一个“海盗对话”,可以选择左手或右手。我希望它对“左”和“右”的不同拼写做出积极的回答(正如您将在代码中看到的那样),但是,当我为所有非“右”或“左”的输入添加最终的“else”代码时,它给了我一
With 语句 对一个对象执行一系列的语句。 With object statements End With 参数 object 必需的部分
While...Wend 语句 当指定的条件为 True 时,执行一系列的语句。 While condition  ; Version [stat
所以我正在处理的代码有一个小问题。 while True: r = input("Line: ") n = r.split() if r == " ":
我有一个对象数组: var contacts = [ { "firstName": "Akira", "lastName": "Laine", "number"
int main() { int f=fun(); ... } int fun() { return 1; return 2; } 在上面的程序中,当从main函数中调用一个
我的项目中有很多 if 语句、嵌套 if 语句和 if-else 语句,我正在考虑将它们更改为 switch 语句。其中一些将具有嵌套的 switch 语句。我知道就编译而言,switch 语句通常更
Rem 语句 包含程序中的解释性注释。 Rem comment 或 ' comment comment 参数是需要包含的注释文本。在 Rem 关键字和 comment 之间应有一个空格。
ReDim 语句 在过程级中声明动态数组变量并分配或重新分配存储空间。 ReDim [Preserve] varname(subscripts) [, varname(subscripts)]
Randomize 语句 初始化随机数生成器。 Randomize [number] number 参数可以是任何有效的数值表达式。 说明 Randomize 使用 number 参数初始
Public 语句 定义公有变量并分配存储空间。在 Class 块中定义私有变量。 Public varname[([subscripts])][, varname[([subscripts])
Sub 语句 声明 Sub 过程的名称、参数以及构成其主体的代码。 [Public [Default]| Private] Sub name [( arglist )]
Set 语句 将对象引用赋给一个variable或property,或者将对象引用与事件关联。 Set objectvar = {objectexpression | New classname
我有这个代码块,有时第一个 if 语句先运行,有时第二个 if 语句先运行。我不确定为什么会这样,因为我认为 javascript 是同步的。 for (let i = 0; i < dataObje
这是一个 javascript 代码,我想把它写成这样:如果此人回答是,则回复“那很酷”,如果此人回答否,则回复“我会让你开心”,如果此人回答的问题包含"is"或“否”,请说“仅键入”是或否,没有任何
这是我的任务,我尝试仅使用简短的 if 语句来完成此任务,我得到的唯一错误是使用“(0.5<=ratio<2 )”,除此之外,构造正确吗? Scanner scn = new Scanner(
有没有办法在 select 语句中使用 if 语句? 我不能在这个中使用 Case 语句。实际上我正在使用 iReport 并且我有一个参数。我想要做的是,如果用户没有输入某个参数,它将选择所有实例。
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: If vs. Switch Speed 我将以 C++ 为例,但我要问的问题不是针对特定语言的。我的意思是一
Property Set 语句 在 Class 块中,声明名称、参数和代码,这些构成了将引用设置到对象的 Property 过程的主体。 [Public | Private] Pro
Property Let 语句 在 Class 块中,声明名称、参数和代码等,它们构成了赋值(设置)的 Property 过程的主体。 [Public | Private] Prop
我是一名优秀的程序员,十分优秀!