- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
考虑给定的两种情况,
在下面的这种情况下,我只是运行两个嵌套循环,它们都是从 0
初始化的并运行到 100000
.
int k = 100000;
for(i=0;i<k;i++)
for(j=0;j<k;j++){
// Do nothing
}
time
在我的系统上 = 22.6 seconds
我又在做同样的事情,只是递增一个变量 c
里面。
int k = 100000, cnt=0;
for(i=0;i<k;i++)
for(j=0;j<k;j++){
cnt++;
}
time
在我的系统上 = 19.6 seconds
怎么会???为什么时间在case2 < case1
??
最佳答案
我只是重现了结果,并问了自己与 OP 相同的问题。
代码如下:
>>>> test1.c
int
main ()
{
long long int i;
long long int j;
long long int k = 100000;
for(i=0;i<k;i++)
for(j=0;j<k;j++)
{
// Do nothing
}
return 0;
}
.
>>>> test2.c
int
main ()
{
long long int i;
long long int j;
long long int c = 0;
long long int k = 100000;
for(i=0;i<k;i++)
for(j=0;j<k;j++)
{
c++;
}
return 0;
}
在 amd64 gentoo linux 机器上用 gcc -o testx testx.c -g
编译。运行时,我得到以下时间:
test1: 0m32.000s
test2: 0m28.307s
这个我测试了很多次,推导量小得惊人。
要了解此处发生的情况,我们必须查看反汇编。
>>>> test1
Dump of assembler code for function main:
0x00000000004004fc <+0>: push %rbp
0x00000000004004fd <+1>: mov %rsp,%rbp
0x0000000000400500 <+4>: movq $0x186a0,-0x18(%rbp)
0x0000000000400508 <+12>: movq $0x0,-0x8(%rbp)
0x0000000000400510 <+20>: jmp 0x400530 <main+52>
0x0000000000400512 <+22>: movq $0x0,-0x10(%rbp)
0x000000000040051a <+30>: jmp 0x400521 <main+37>
0x000000000040051c <+32>: addq $0x1,-0x10(%rbp)
0x0000000000400521 <+37>: mov -0x10(%rbp),%rax
0x0000000000400525 <+41>: cmp -0x18(%rbp),%rax
0x0000000000400529 <+45>: jl 0x40051c <main+32>
0x000000000040052b <+47>: addq $0x1,-0x8(%rbp)
0x0000000000400530 <+52>: mov -0x8(%rbp),%rax
0x0000000000400534 <+56>: cmp -0x18(%rbp),%rax
0x0000000000400538 <+60>: jl 0x400512 <main+22>
0x000000000040053a <+62>: mov $0x0,%eax
0x000000000040053f <+67>: pop %rbp
0x0000000000400540 <+68>: retq
End of assembler dump.
.
>>>> test2:
Dump of assembler code for function main:
0x00000000004004fc <+0>: push %rbp
0x00000000004004fd <+1>: ov %rsp,%rbp
0x0000000000400500 <+4>: movq $0x0,-0x18(%rbp)
0x0000000000400508 <+12>: movq $0x186a0,-0x20(%rbp)
0x0000000000400510 <+20>: movq $0x0,-0x8(%rbp)
0x0000000000400518 <+28>: jmp 0x40053d <main+65>
0x000000000040051a <+30>: movq $0x0,-0x10(%rbp)
0x0000000000400522 <+38>: jmp 0x40052e <main+50>
0x0000000000400524 <+40>: addq $0x1,-0x18(%rbp)
0x0000000000400529 <+45>: addq $0x1,-0x10(%rbp)
0x000000000040052e <+50>: mov -0x10(%rbp),%rax
0x0000000000400532 <+54>: cmp -0x20(%rbp),%rax
0x0000000000400536 <+58>: jl 0x400524 <main+40>
0x0000000000400538 <+60>: addq $0x1,-0x8(%rbp)
0x000000000040053d <+65>: mov -0x8(%rbp),%rax
0x0000000000400541 <+69>: cmp -0x20(%rbp),%rax
0x0000000000400545 <+73>: jl 0x40051a <main+30>
0x0000000000400547 <+75>: mov $0x0,%eax
0x000000000040054c <+80>: pop %rbp
0x000000000040054d <+81>: retq
End of assembler dump.
正如预期的那样,它看起来非常相似。
我在下面的 test2 注释版本中突出显示了代码的作用。装配线的缩进表示它们所处的循环级别或它们实现的级别。
>>>> test2:
Dump of assembler code for function main:
// setup the stackframe
0x00000000004004fc <+0>: push %rbp
0x00000000004004fd <+1>: ov %rsp,%rbp
// initialize variable c
0x0000000000400500 <+4>: movq $0x0,-0x18(%rbp)
// initialize variable k
0x0000000000400508 <+12>: movq $0x186a0,-0x20(%rbp)
// initialize variable i
0x0000000000400510 <+20>: movq $0x0,-0x8(%rbp)
// enter the outer loop
0x0000000000400518 <+28>: jmp 0x40053d <main+65>
// initialize variable j
0x000000000040051a <+30>: movq $0x0,-0x10(%rbp)
// enter the inner loop
0x0000000000400522 <+38>: jmp 0x40052e <main+50>
// increment variable c
0x0000000000400524 <+40>: addq $0x1,-0x18(%rbp)
// increment variable j
0x0000000000400529 <+45>: addq $0x1,-0x10(%rbp)
// check if the inner loop condition still holds
0x000000000040052e <+50>: mov -0x10(%rbp),%rax
0x0000000000400532 <+54>: cmp -0x20(%rbp),%rax
// jump to the start of the inner loop, if true, else continue
0x0000000000400536 <+58>: jl 0x400524 <main+40>
// increment variable i
0x0000000000400538 <+60>: addq $0x1,-0x8(%rbp)
// check if the outer loop condition still holds
0x000000000040053d <+65>: mov -0x8(%rbp),%rax
0x0000000000400541 <+69>: cmp -0x20(%rbp),%rax
// jump to the start of the outer loop, if true, else continue
0x0000000000400545 <+73>: jl 0x40051a <main+30>
// tear down and return to main
0x0000000000400547 <+75>: mov $0x0,%eax
0x000000000040054c <+80>: pop %rbp
0x000000000040054d <+81>: retq
End of assembler dump.
可以看到,代码结构与实际的C代码非常相似,test1和test2的汇编差别很小。
test2 执行速度稍快的原因可能深深地隐藏在您的硬件规范中。我认为现代处理器可能已经为简单循环优化了指令缓存和流水线,因为它们在程序中很常见,并且优化不适用于空循环,因为它们 (1) 在实际程序中非常罕见(2) 运行时优化实际上对空循环并不重要,因为它们通常用于(忙)等待。
无论出于何种原因,它可能在学术上很有趣,但对实际软件的影响可能不存在 :)
我刚刚找到了英特尔发布的这份文件,如果您对细节感兴趣,那应该是一本有趣的书 http://www.google.de/url?sa=t&rct=j&q=&esrc=s&source=web&cd=4&cad=rja&ved=0CFgQFjAD&url=http%3A%2F%2Fwww.agner.org%2Foptimize%2Fmicroarchitecture.pdf&ei=8-sVUtWyM8nPtAb4ooCQBQ&usg=AFQjCNGRPm4A8ixWqSSGOOtNPCxp1YRfQg&sig2=Qe6Nxmz4Lee5Oo8UOGwTJw&bvm=bv.51156542,d.Yms
关于c - 意外的运行时差,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18368227/
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许在 Stack Overflow 上提出有关通用计算硬件和软件的问题。您可以编辑问题,使其成为
当我尝试在 db2 中创建表时,它抛出以下错误 $ db2 CREATE TABLE employee(emp_id INT NOT NULL, emp_name VARCHAR(100)) sh:
我有: while (i < l) { if (one === two) { continue; } i++; } 但是 JSLint 说: Problem at line 1 chara
所以我有这个代码: char inputs[10] = ""; int numInputs = 0; while (numInputs < 10){ char c; printf("E
var ninja = { name: 'Ninja', say: function () { return 'I am a ' + this.name; }
我收到一个我不明白的错误,请注意,我是编码新手,所以这可能是一个简单的错误。 #include using namespace std; int main() { //Initialise Fahr
我正在使用 javascript 和 react,由于某种原因,我收到了一个奇怪的 token 错误。 这是发生错误的代码: renderNavBar() { if (!this.us
Closed. This question is off-topic。它当前不接受答案。
由于某种我无法解释的原因,编译器正在输出一个错误,指出它发现了一个意外的#else 标记。 这发生在文件的开头: #if defined( _USING_MFC ) #include "stda
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
这个问题在这里已经有了答案: Difference between sh and Bash (11 个答案) 关闭 2 年前。 我正在编写一个简单的 bash 脚本,我在 XX `(' unexpe
关闭。这个问题是not reproducible or was caused by typos .它目前不接受答案。 此问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-topic
我在 Windows 7 上编写了一个脚本,它不断给我一个错误“(此时出乎意料。”对于以下代码 if %vardns%=="NODNS" ( netsh interface ipv4 set ad
我正在尝试使用xmlstarlet(使用xpath)解析XML文件,但是出现语法错误,并且我不知道如何更正我的代码。 这是我的脚本: #!/bin/bash if [ $1=="author" ];
以下脚本旨在在目录中的所有文件上运行程序“senna”,并将每个文件的输出(保留输入文件名)写入另一个目录 for file in ./Data/in/*; do ./senna -iobta
我从 challengers.coffee 运行此代码,并收到错误 ActionView::Template::Error (SyntaxError: [stdin]:3:31:unexpected
我在 config.db.database; 行中有语法错误(意外的标记“.”)。这是我在文件中的代码 const config = require('../config/config') const
这一定很明显,但是我无法使它正常工作。我正在尝试传输应该用于构建$ classKey的对象,这反过来又导致删除所需的软件(amd64或i386)。好吧,这里的代码: $name = @("softwa
我正在使用 1.3.7 版学习 Grails,但我一直无缘无故地遇到以下语法错误: unexpected token: mapping @ line x, column y. 有一次,我通过运行“gr
我正在尝试找出这段Pascal代码的问题 function Factorial(n: integer): integer; begin if n = 0 then Result := 1
我是一名优秀的程序员,十分优秀!