c - 意外的运行时差-6ren

c - 意外的运行时差

转载作者：太空狗更新时间：2023-10-29 15:58:33

25

4

考虑给定的两种情况，

在下面的这种情况下，我只是运行两个嵌套循环，它们都是从 0 初始化的并运行到 100000 .

int k = 100000;
for(i=0;i<k;i++)
    for(j=0;j<k;j++){
    // Do nothing
 }

time在我的系统上 = 22.6 seconds

我又在做同样的事情，只是递增一个变量 c里面。

int k = 100000, cnt=0;
for(i=0;i<k;i++)
    for(j=0;j<k;j++){
    cnt++;
 }

time在我的系统上 = 19.6 seconds

怎么会？？？为什么时间在case2 < case1 ??

最佳答案

我只是重现了结果，并问了自己与 OP 相同的问题。

代码如下:

>>>> test1.c
int
main ()
{
  long long int i;
  long long int j;
  long long int k = 100000;
  for(i=0;i<k;i++)
    for(j=0;j<k;j++)
      {
        // Do nothing
      }

  return 0;
}

.

>>>> test2.c
int
main ()
{
  long long int i;
  long long int j;
  long long int c = 0;

  long long int k = 100000;
  for(i=0;i<k;i++)
    for(j=0;j<k;j++)
      {
        c++;
      }

  return 0;
}

在 amd64 gentoo linux 机器上用 gcc -o testx testx.c -g 编译。运行时，我得到以下时间:

  test1: 0m32.000s
  test2: 0m28.307s

这个我测试了很多次，推导量小得惊人。

要了解此处发生的情况，我们必须查看反汇编。

>>>> test1
Dump of assembler code for function main:
   0x00000000004004fc <+0>:     push   %rbp
   0x00000000004004fd <+1>:     mov    %rsp,%rbp
   0x0000000000400500 <+4>:     movq   $0x186a0,-0x18(%rbp)
   0x0000000000400508 <+12>:    movq   $0x0,-0x8(%rbp)
   0x0000000000400510 <+20>:    jmp    0x400530 <main+52>
   0x0000000000400512 <+22>:    movq   $0x0,-0x10(%rbp)
   0x000000000040051a <+30>:    jmp    0x400521 <main+37>
   0x000000000040051c <+32>:    addq   $0x1,-0x10(%rbp)
   0x0000000000400521 <+37>:    mov    -0x10(%rbp),%rax
   0x0000000000400525 <+41>:    cmp    -0x18(%rbp),%rax
   0x0000000000400529 <+45>:    jl     0x40051c <main+32>
   0x000000000040052b <+47>:    addq   $0x1,-0x8(%rbp)
   0x0000000000400530 <+52>:    mov    -0x8(%rbp),%rax
   0x0000000000400534 <+56>:    cmp    -0x18(%rbp),%rax
   0x0000000000400538 <+60>:    jl     0x400512 <main+22>
   0x000000000040053a <+62>:    mov    $0x0,%eax
   0x000000000040053f <+67>:    pop    %rbp
   0x0000000000400540 <+68>:    retq   
End of assembler dump.

.

>>>> test2:
Dump of assembler code for function main:
   0x00000000004004fc <+0>:     push   %rbp
   0x00000000004004fd <+1>:     ov    %rsp,%rbp
   0x0000000000400500 <+4>:     movq   $0x0,-0x18(%rbp)
   0x0000000000400508 <+12>:    movq   $0x186a0,-0x20(%rbp)
   0x0000000000400510 <+20>:    movq   $0x0,-0x8(%rbp)
   0x0000000000400518 <+28>:    jmp    0x40053d <main+65>
   0x000000000040051a <+30>:    movq   $0x0,-0x10(%rbp)
   0x0000000000400522 <+38>:    jmp    0x40052e <main+50>
   0x0000000000400524 <+40>:    addq   $0x1,-0x18(%rbp)
   0x0000000000400529 <+45>:    addq   $0x1,-0x10(%rbp)
   0x000000000040052e <+50>:    mov    -0x10(%rbp),%rax
   0x0000000000400532 <+54>:    cmp    -0x20(%rbp),%rax
   0x0000000000400536 <+58>:    jl     0x400524 <main+40>
   0x0000000000400538 <+60>:    addq   $0x1,-0x8(%rbp)
   0x000000000040053d <+65>:    mov    -0x8(%rbp),%rax
   0x0000000000400541 <+69>:    cmp    -0x20(%rbp),%rax
   0x0000000000400545 <+73>:    jl     0x40051a <main+30>
   0x0000000000400547 <+75>:    mov    $0x0,%eax
   0x000000000040054c <+80>:    pop    %rbp
   0x000000000040054d <+81>:    retq   
End of assembler dump.

正如预期的那样，它看起来非常相似。

我在下面的 test2 注释版本中突出显示了代码的作用。装配线的缩进表示它们所处的循环级别或它们实现的级别。

>>>> test2:
Dump of assembler code for function main:
   // setup the stackframe
   0x00000000004004fc <+0>:     push   %rbp
   0x00000000004004fd <+1>:     ov    %rsp,%rbp
   // initialize variable c
   0x0000000000400500 <+4>:     movq   $0x0,-0x18(%rbp)
   // initialize variable k
   0x0000000000400508 <+12>:    movq   $0x186a0,-0x20(%rbp)
     // initialize variable i
     0x0000000000400510 <+20>:  movq   $0x0,-0x8(%rbp)
     // enter the outer loop
     0x0000000000400518 <+28>:  jmp    0x40053d <main+65>
       // initialize variable j
       0x000000000040051a <+30>:    movq   $0x0,-0x10(%rbp)
       // enter the inner loop
       0x0000000000400522 <+38>:    jmp    0x40052e <main+50>
         // increment variable c
         0x0000000000400524 <+40>:  addq   $0x1,-0x18(%rbp)
       // increment variable j
       0x0000000000400529 <+45>:    addq   $0x1,-0x10(%rbp)
       // check if the inner loop condition still holds
       0x000000000040052e <+50>:    mov    -0x10(%rbp),%rax
       0x0000000000400532 <+54>:    cmp    -0x20(%rbp),%rax
       // jump to the start of the inner loop, if true, else continue
       0x0000000000400536 <+58>:    jl     0x400524 <main+40>
     // increment variable i
     0x0000000000400538 <+60>:  addq   $0x1,-0x8(%rbp)
     // check if the outer loop condition still holds
     0x000000000040053d <+65>:  mov    -0x8(%rbp),%rax
     0x0000000000400541 <+69>:  cmp    -0x20(%rbp),%rax
     // jump to the start of the outer loop, if true, else continue
     0x0000000000400545 <+73>:  jl     0x40051a <main+30>
   // tear down and return to main
   0x0000000000400547 <+75>:    mov    $0x0,%eax
   0x000000000040054c <+80>:    pop    %rbp
   0x000000000040054d <+81>:    retq   
End of assembler dump.

可以看到，代码结构与实际的C代码非常相似，test1和test2的汇编差别很小。

test2 执行速度稍快的原因可能深深地隐藏在您的硬件规范中。我认为现代处理器可能已经为简单循环优化了指令缓存和流水线，因为它们在程序中很常见，并且优化不适用于空循环，因为它们 (1) 在实际程序中非常罕见(2) 运行时优化实际上对空循环并不重要，因为它们通常用于(忙)等待。

无论出于何种原因，它可能在学术上很有趣，但对实际软件的影响可能不存在 :)

我刚刚找到了英特尔发布的这份文件，如果您对细节感兴趣，那应该是一本有趣的书 http://www.google.de/url?sa=t&rct=j&q=&esrc=s&source=web&cd=4&cad=rja&ved=0CFgQFjAD&url=http%3A%2F%2Fwww.agner.org%2Foptimize%2Fmicroarchitecture.pdf&ei=8-sVUtWyM8nPtAb4ooCQBQ&usg=AFQjCNGRPm4A8ixWqSSGOOtNPCxp1YRfQg&sig2=Qe6Nxmz4Lee5Oo8UOGwTJw&bvm=bv.51156542,d.Yms

关于c - 意外的运行时差，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18368227/

25

4

0

文章推荐： c - 在 DllMain() 之前调用了哪些函数？

文章推荐： html - 在 CruiseControl 仪表板中显示 HTML 报告

军时C++时差
我正在尝试创建一个程序，该程序采用两个军事时间的差异并获取其时差。示例: **上午到下午** 时间 1:0900 时间 2:1730 时差:8 小时 30 分钟 **下午到上午** 时间 1:120
MYSQL 时差
我正在尝试计算两个时间字段之间的时间差异。由于这些字段只是没有日期的时间，因此我无法使用 timestampdiff，因此我使用 timediff() 或 subtime() 。唯一的问题是，当第二次
JavaScript 时差
我试图简单地计算 5:30:00 - 2:30:00 的时差。显然这应该导致 3:00:00 但是当我在控制台中执行以下代码时 var a = new Date(0,0,0,5,30,0) var b
C 时差
我试图在 C 中区分两个日期，但我收到这样的输出: future date: 18-11-2013 22:8 current date: 18-11-2013 22:8 这是我的代码: #includ
mysql - 时差(分钟)
我正在尝试计算截至上午 00:00 的剩余分钟数。 DELIMITER // CREATE PROCEDURE midnightCountdown() BEGIN SELECT TIME_FORMAT
postgresql - Postgres 时差
我正在尝试使用 postgresql 从表(login_history as t1)中检索以分钟为单位的时差。当我尝试这段代码时 ((date_part('hour', timestamp '201
mysql - Laravel - 时差
欢迎!我有问题想问你。我正在 Laravel 5.2 中为自己编写飞行日志。在公式中，我将有起飞时间和到达时间，但我不知道如何在 laravel 中计算时间差并将其自动传递到数据库。因此，最简单的方法
java - android - 时差
我已经查看了有关此主题的其他问答，但没有找到任何帮助。我的应用记录比赛结果并保存到文件。第一次点击它会写入当前时间，当运行者完成后，它会再次记录当前时间。如何计算这两个时间以获得比赛时间？这是
java - 时差 - 奇怪的结果
我有非常简单的代码来计算两次之间的差异: import java.text.SimpleDateFormat; import java.util.Date; import java.util.Greg
Python速度测试 - 时差 - 毫秒
在 Python 中比较 2 次以加快测试一段代码的正确方法是什么？我尝试阅读 API 文档。我不确定我是否理解 timedelta。到目前为止，我有这个代码: from datetime impo
excel - CSV的最佳时间跨度(时差)格式
这个问题非常类似于Best timestamp format for CSV/Excel? : 我正在写一个 CSV 文件。我需要编写至少精确到秒，最好精确到毫秒的时间跨度(又名时差)。 CSV 文件
java - Java AM/PM 时差
我试图通过输入时间格式计算12小时内的java时差，当我输入开始时间11:58:10 pm和结束时间12:02时效果很好:15 点。但当我输入 12:00:00 am 和 12:00:00 pm 时，
java - java 军事时间时差
因此，对于一项作业，我们必须编写一个程序，该程序需要两次军事时间，并显示它们之间的小时和分钟差异，假设第一次是两次时间中较早的一次。我们不允许使用 if 语句，因为它在技术上尚未被学习。这是运行时的示
php - 24 小时时间表 - 时差
我必须为分布在全局各地的所有人员制定 24 小时时间表。例如，某人可以在 10:00 开始工作，并在 19:00 结束工作，因此获得时差非常简单，因为结束时间和开始时间在同一天。但是，如果我有人在
python - NTPLib 时差 + Python
使用 ntp 时间时，(英国)返回的时间总是比实际时间少一小时。例如:现在时间是 13.35 但当我说日期时，它返回 12.35。有什么建议？ try: c = ntplib.
php - Laravel 5 时差
我有一个应用程序，它在登录时记录时间，在退出时记录退出时间。我的表有 IN_TIME 和 OUT_TIME 这些列中的数据示例: IN_TIME = 16:06:46 结束时间 = 16:08:07
php - 时差、php、mysql、ajax
我使用 $_POST 将变量从 ajax 表单发布到 php 服务器端我有两个变量，时间和金额。在服务器中，我有一个 MYSQL 数据库，其中包含 _end_time (数据类型:时间)和金额(数据类
PHP - 时差(HH :MM format)
我正在尝试计算在这里工作的人的轮类模式，从结束时间减去开始时间在大多数情况下都有效，但如果他们通宵工作则不行。例如，从 10pm 到 6am 工作的人将显示为: 22:00 - 06:00 我希望返回
excel - 在 Excel 中计算 UTC 时差
任何人都可以提供一个 Excel 方程来计算两个 UTC 时间戳之间的差异。 UTC 时间戳的格式为 yyyymmddhhmmssZ(例如 20160127175049Z)。时间戳之间的差异最多为几个
machine-learning - Q 学习、时差、基于模型的强化学习
我在大学学习一门名为“智能机器”的类(class)。我们向我们介绍了 3 种强化学习方法，并通过这些方法我们获得了何时使用它们的直觉，我引用: Q-Learning - 当 MDP 无法解决时最好。

首页

博学

6Ren·AI

商城

c - 意外的运行时差