虚拟机的 C++ For 循环优化-6ren

虚拟机的 C++ For 循环优化

转载作者：太空狗更新时间：2023-10-29 20:55:32

上下文

我的问题是双重的(实际上是两个问题)但非常基本*。但首先，我将针对某些上下文展示一些相关代码。对于 TL;DR“肉和土 bean ”，请跳至实际问题的底部。

*(我假设回答者在尝试回答之前了解正在发生的事情/虚拟机如何从根本上运行)。

如前所述，我正在编写一个(玩具)VM，它执行自定义字节码指令集。

(此处省略号仅代表省略部分情况)

这是我的代码片段:

for (ip = 0; (ip < _PROGRAM_SIZE || !cstackempty); ip++) {
        if (breakPending) { break; }

            switch (_instr) {

               case INST::PUSH: {
                   AssertAbort(wontoverflow(1), "Stack overflow (1 byte)");
                   cmd_ "PUSH";
                   push(_incbyte);
                   printStack();
                   break;
               }

        ...
               case INST::ADD: {
                   AssertAbort(stackhas(2), "Can't pop stack to add 2 bytes. Stack does not contain 2 bytes");
                   cmd_ "ADD";
                   byte popped8_a = pop();
                   byte popped8_b = pop();
                   byte result = popped8_a + popped8_b;
                   push(result);
                   cmd_ " "; cmd_(byte)result;
                   printStack();
                   break;
               }

               case INST::ADD16: {
                   AssertAbort(stackhas(4), "Can't pop stack to add 4 bytes. Stack does not contain 4 bytes");
                   cmd_ "ADD16";
                   u16 popped16_a = pop16();
                   u16 popped16_b = pop16();
                   u16 result = popped16_a + popped16_b;
                   push16(result);
                   cmd << " "; cmd << (u16)result;
                   printStack();
                   break;
               }
        ...
            }
}

只是因为它是相关的，我才会提到它 _cstack 是调用堆栈，因此 !cstackempty 宏，它在调用退出(退出 for 循环)之前检查调用是否为空，只是因为它是最后一条被执行的指令(因为最后一条指令可以是函数的一部分，甚至是返回)。另外， ip (指令指针)只是一个 unsigned long long (u64)，原样 _PROGRAM_SIZE (以字节为单位的程序大小)。 <em>instr</em> 是一个字节，是对当前指令的引用(1 字节)。

肉和土 bean

问题 1:由于我正在为每个 block /案例初始化两个可变大小的新整数(分割成 block 以避免重新声明错误等)，所以会在 for 之上声明它们loop 在速度、分配延迟、程序大小等方面有帮助吗？

问题 2:会 continue比 break 快在这种情况下，有没有更快的方法来执行这样的条件循环，例如像 this post 中的某种 goto-pointer-to-label ，即与实现无关，或者以某种方式避免 continue 的成本或 break ？

总而言之，我的首要任务是速度，然后是内存成本(速度、效率)，然后是文件大小(虚拟机的)。

最佳答案

在回答具体问题之前，请注意:没有任何CPU 直接执行C++。因此，这种语言级别的微优化的任何问题都在很大程度上取决于编译器、软件运行时环境和目标硬件。完全有可能一种技术在您今天使用的编译器上效果更好，但在您明天使用的编译器上效果更差。对于 CPU 架构等硬件选择也是如此。

要确定哪个更好，唯一的方法是在现实情况下对其进行基准测试，而了解基准测试结果的唯一方法通常是深入研究生成的程序集。如果这种优化对您很重要，请考虑为您的开发架构学习一些汇编语言。

鉴于此，我将选择一个特定的编译器 (gcc) 和一个通用架构 (x86) 并在该上下文中进行回答。其他选择的细节会略有不同，但我希望任何体面的编译器和硬件组合的大致思路都是相似的。

问题一

声明的位置无关紧要。声明本身甚至没有真正变成代码——它只是生成代码的定义和使用。

例如，考虑下面一个简单循环的两个变体(外部 sink() 方法只是为了避免优化分配给 a 的方式):

循环内声明

int func(int* num) {
  for (unsigned int i=0; i<100; i++) {
    int a = *num + *num;
    sink(a);
    sink(a);
  }
}

循环外声明

int func(int* num) {
  int a;
  for (unsigned int i=0; i<100; i++) {
    a = *num + *num;
    sink(a);
    sink(a);
  }
}

我们可以使用 Godbolt 编译器资源管理器轻松检查为 first 生成的程序集。和 second变体。它们是相同的 - 这是循环:

.L2:
        mov     ebp, DWORD PTR [r12]
        add     ebx, 1
        add     ebp, ebp
        mov     edi, ebp
        call    sink(int)
        mov     edi, ebp
        call    sink(int)
        cmp     ebx, 100
        jne     .L2

基本上声明不会产生任何代码——只有赋值会产生。

问题2

这里需要注意的是，在硬件级别，没有像“中断”或“继续”这样的指令。您实际上只有跳转，无论是否有条件，基本上都是 goto。 break 和 continue 都将被转换为跳跃。在您的情况下，开关内的中断，中断是循环中的最后一条语句，和开关内的继续具有完全相同的效果，所以我期望它们的编译方式相同，但让我们检查一下。

让我们使用这个测试用例:

int func(unsigned int num, int iters) {
  for (; iters > 0; iters--) {
    switch (num) {
      case 0:
        sinka();
        break;
      case 1:
        sinkb();
        break;
      case 2:
        sinkc();
        break;
      case 3:
        sinkd();
        break;
      case 4:
        sinkd();
        break;
    }
  }
}

它使用中断存在的情况。这是 godbolt output在 x86 的 gcc 4.4.7 上，忽略函数序言:

.L13:
        cmp     ebp, 4
        ja      .L3
        jmp     [QWORD PTR [r13+r12*8]] # indirect jump
.L9:
        .quad   .L4
        .quad   .L5
        .quad   .L6
        .quad   .L7
        .quad   .L8
.L4:
        call    sinka()
        jmp     .L3
.L5:
        call    sinkb()
        jmp     .L3
.L6
        call    sinkc()
        jmp     .L3
.L7
        call    sinkd()
        jmp     .L3
.L8
        call    sinkd()
.L3:
        sub     ebx, 1
        test    ebx, ebx
        jg      .L13

这里，编译选择了跳表方式。 num 的值用来查找一个跳转地址(该表是一系列.quad指令)，然后间接跳转到标签L4到L8中的一个。中断变为 jmp .L3，执行循环逻辑。

请注意，跳转表并不是编译开关的唯一方法 - 如果我使用 4 个或更少的 case 语句，编译会选择一系列分支。

让我们尝试相同的示例，但每个 break 都替换为 continue:

int func(unsigned int num, int iters) {
  for (; iters > 0; iters--) {
    switch (num) {
      case 0:
        sinka();
        continue;
... [16 lines omitted] ...
    }
  }
}

您现在可能已经猜到了，the results are identical - 用于这个特定的编译器和目标。 continue 语句和 break 语句意味着完全相同的控制流，所以我希望这对于大多数启用优化的体面编译器都是如此。

关于虚拟机的 C++ For 循环优化，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35490572/

文章推荐： c++ - 为什么我最后的 cout 中的第一个字母被截断了？

文章推荐： C# Regex 组多个捕获

文章推荐： c# - Orchard 项目模块出现错误 : No persister for: SomePartRecord

文章推荐： c++ - 如何使用带线程的 Google 测试

vmware - 虚拟机
我一直在尝试弄清VMware是如何工作的(特别是在安装Linux时)，我有两个问题: 当VMware遇到push cs这样的命令时会发生什么？特别是cs，因为其特权级别为0，而VMware以1特权级别
虚拟机。向终端发送命令？
我正在尝试将 vim 配置为我的主要编码程序。我已经想出了如何编译单个文件，但是当我从 vim 中执行程序时，我不断收到 127 错误代码。我的盒子上有 a 别名为 ./a.out，但是当我从 vim
虚拟机。向终端发送命令？
我正在尝试将 vim 配置为我的主要编码程序。我已经想出了如何编译单个文件，但是当我从 vim 中执行程序时，我不断收到 127 错误代码。我的盒子上有 a 别名为 ./a.out，但是当我从 vim
Javascript 虚拟机
想知道有没有什么javascript虚拟机是你用过的或者有什么想法的! 我不是在谈论用于 chrome 的 V8 等浏览器的 javascript 引擎，我想在 linux 服务器机器上执行 java
VirtualBOX(虚拟机)上的ubuntu串口
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题？ Update the question所以它是on-topic对于堆栈溢出。 10年前关闭。 Improve this qu
Azure 虚拟机 - 存储帐户的用途
我正在查找 Azure 中存储帐户的用途。因为我有一个问题。我的帐户仅限于 1 个存储帐户，显然我已经在使用它，但我不知道为什么，我认为我不需要它。我有一台带有云服务和存储帐户的虚拟机。我想创建另
java - 虚拟机: could not open
Error - JVM - BlackBerry 9800 Simulator --------------------------------------- JVM: could not open
Javascript 虚拟机/模拟器？
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 9
linux - 虚拟机-设置centos作为路由器
这是我的情况我需要配置linux系统，因为路由器和客户端也在虚拟机中.. 系统A eth0:从isp获取ip(在VM ware中配置为Bidge) eth1: DEVICE=eth1 BOOTPRO
不需要操作系统的 Java 虚拟机？
我知道 BEA 正在开发不需要底层操作系统的 LiquidVM，但想知道开源社区中是否有人正在开发类似的东西。理想情况下，我想找到一个实现，其中 VM 直接由操作系统引导加载程序加载。最佳答案与
在Linux系统下安装Vmware(虚拟机)图文教程步骤详细介绍
Linux系统下安装Vmware教程由于项目需要，要在Linux下虚拟一个Windows，经过查找些资料，发现可一用VMware来实现,当然还有其他一些虚拟机可以使用如Win4lin,bochs
sharepoint - 如何重命名 SharePoint 虚拟机
我正在使用虚拟机进行开发，但是每次我需要一个新的 VM 时，我都会复制文件并创建一个新服务器，但是我需要一个新的服务器名称才能将其添加到我们的网络中。重命名服务器后，Sharepoint 站点有很多
c# - 如何连接到 Cassandra 虚拟机
如果 Cassandra 和代码在同一台机器上，则以下代码有效: using System; using Cassandra; namespace CassandraInsertTest {
vmware - 如何杀死不会死的 VMware 虚拟机？
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
虚拟机/管理程序中的 CUDA/OpenCL
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 3年前关闭。 Improve this qu
azure - 将错误记录到 azure 虚拟机？
我正在将我的 Web 应用程序 try catch 异常错误跟踪消息转储到 Web 服务器上的 C:\Temp 文件夹但是当我的 web 应用程序位于 azure 上时，我希望在 azure VM c
azure - 如何为多用户环境配置 Azure 虚拟机
我们为客户提供桌面 ERP 软件。该软件安装在 Azure 虚拟机中。每个公司都有自己的数据库文件。我需要优化性能，但我有些怀疑无法找到回应。例如，对于 2 个公司: 1-购买 2 台小型 VM(2
azure - 无法访问 Azure 虚拟机
我试图将 Azure 上的虚拟机的网络号地址更改为与 Azure 池上的另一个虚拟机位于同一网络中，一旦我单击网卡上的“保存”，它就会卡住并无法通过远程桌面或任何其他方式。请帮忙。最佳答案切勿尝
azure - 共享 Azure 虚拟机
是否可以在 Azure 上设置虚拟机并使该虚拟机的同一实例对多个用户可见？我们是 ISV。我们的用户分散在全局。我们希望使用 Azure 虚拟机来指导用户设置我们的软件。理想情况下，我们的帮助台将在
azure - 无法连接到 Azure 虚拟机
我使用 Ubuntu 镜像创建了一个虚拟机，并从 Azure 库预加载了 Discourse。自动设置完成后，我可以看到虚拟机正在运行，但我无法连接到它以远程查看计算机。我没有看到任何设置可以为我解决

太空狗

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

虚拟机的 C++ For 循环优化

问题一

问题2