- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
上下文
我的问题是双重的(实际上是两个问题)但非常基本*。但首先,我将针对某些上下文展示一些相关代码。对于 TL;DR“肉和土 bean ”,请跳至实际问题的底部。
*(我假设回答者在尝试回答之前了解正在发生的事情/虚拟机如何从根本上运行)。
如前所述,我正在编写一个(玩具)VM,它执行自定义字节码指令集。
(此处省略号仅代表省略部分情况)
这是我的代码片段:
for (ip = 0; (ip < _PROGRAM_SIZE || !cstackempty); ip++) {
if (breakPending) { break; }
switch (_instr) {
case INST::PUSH: {
AssertAbort(wontoverflow(1), "Stack overflow (1 byte)");
cmd_ "PUSH";
push(_incbyte);
printStack();
break;
}
...
case INST::ADD: {
AssertAbort(stackhas(2), "Can't pop stack to add 2 bytes. Stack does not contain 2 bytes");
cmd_ "ADD";
byte popped8_a = pop();
byte popped8_b = pop();
byte result = popped8_a + popped8_b;
push(result);
cmd_ " "; cmd_(byte)result;
printStack();
break;
}
case INST::ADD16: {
AssertAbort(stackhas(4), "Can't pop stack to add 4 bytes. Stack does not contain 4 bytes");
cmd_ "ADD16";
u16 popped16_a = pop16();
u16 popped16_b = pop16();
u16 result = popped16_a + popped16_b;
push16(result);
cmd << " "; cmd << (u16)result;
printStack();
break;
}
...
}
}
只是因为它是相关的,我才会提到它 _cstack
是调用堆栈,因此 !cstackempty
宏,它在调用退出(退出 for 循环)之前检查调用是否为空,只是因为它是最后一条被执行的指令(因为最后一条指令可以是函数的一部分,甚至是返回)。另外, ip
(指令指针)只是一个 unsigned long long (u64),原样 _PROGRAM_SIZE
(以字节为单位的程序大小)。 <em>instr</em>
是一个字节,是对当前指令的引用(1 字节)。
问题 1:由于我正在为每个 block /案例初始化两个可变大小的新整数(分割成 block 以避免重新声明错误等),所以会在 for
之上声明它们loop 在速度、分配延迟、程序大小等方面有帮助吗?
问题 2:会 continue
比 break
快在这种情况下,有没有更快的方法来执行这样的条件循环,例如像 this post 中的某种 goto-pointer-to-label ,即与实现无关,或者以某种方式避免 continue
的成本或 break
?
总而言之,我的首要任务是速度,然后是内存成本(速度、效率),然后是文件大小(虚拟机的)。
最佳答案
在回答具体问题之前,请注意:没有任何CPU 直接执行C++。因此,这种语言级别的微优化的任何问题都在很大程度上取决于编译器、软件运行时环境和目标硬件。完全有可能一种技术在您今天使用的编译器上效果更好,但在您明天使用的编译器上效果更差。对于 CPU 架构等硬件选择也是如此。
要确定哪个更好,唯一的方法是在现实情况下对其进行基准测试,而了解基准测试结果的唯一方法通常是深入研究生成的程序集。如果这种优化对您很重要,请考虑为您的开发架构学习一些汇编语言。
鉴于此,我将选择一个特定的编译器 (gcc) 和一个通用架构 (x86) 并在该上下文中进行回答。其他选择的细节会略有不同,但我希望任何体面的编译器和硬件组合的大致思路都是相似的。
声明的位置无关紧要。声明本身甚至没有真正变成代码——它只是生成代码的定义和使用。
例如,考虑下面一个简单循环的两个变体(外部 sink()
方法只是为了避免优化分配给 a
的方式):
循环内声明
int func(int* num) {
for (unsigned int i=0; i<100; i++) {
int a = *num + *num;
sink(a);
sink(a);
}
}
循环外声明
int func(int* num) {
int a;
for (unsigned int i=0; i<100; i++) {
a = *num + *num;
sink(a);
sink(a);
}
}
我们可以使用 Godbolt 编译器资源管理器轻松检查为 first 生成的程序集。和 second变体。它们是相同的 - 这是循环:
.L2:
mov ebp, DWORD PTR [r12]
add ebx, 1
add ebp, ebp
mov edi, ebp
call sink(int)
mov edi, ebp
call sink(int)
cmp ebx, 100
jne .L2
基本上声明不会产生任何代码——只有赋值会产生。
这里需要注意的是,在硬件级别,没有像“中断”或“继续”这样的指令。您实际上只有跳转,无论是否有条件,基本上都是 goto。 break 和 continue 都将被转换为跳跃。在您的情况下,开关内的中断,中断是循环中的最后一条语句,和开关内的继续具有完全相同的效果,所以我期望它们的编译方式相同,但让我们检查一下。
让我们使用这个测试用例:
int func(unsigned int num, int iters) {
for (; iters > 0; iters--) {
switch (num) {
case 0:
sinka();
break;
case 1:
sinkb();
break;
case 2:
sinkc();
break;
case 3:
sinkd();
break;
case 4:
sinkd();
break;
}
}
}
它使用中断存在的情况。这是 godbolt output在 x86 的 gcc 4.4.7 上,忽略函数序言:
.L13:
cmp ebp, 4
ja .L3
jmp [QWORD PTR [r13+r12*8]] # indirect jump
.L9:
.quad .L4
.quad .L5
.quad .L6
.quad .L7
.quad .L8
.L4:
call sinka()
jmp .L3
.L5:
call sinkb()
jmp .L3
.L6
call sinkc()
jmp .L3
.L7
call sinkd()
jmp .L3
.L8
call sinkd()
.L3:
sub ebx, 1
test ebx, ebx
jg .L13
这里,编译选择了跳表方式。 num 的值用来查找一个跳转地址(该表是一系列.quad
指令),然后间接跳转到标签L4到L8中的一个。中断变为 jmp .L3
,执行循环逻辑。
请注意,跳转表并不是编译开关的唯一方法 - 如果我使用 4 个或更少的 case 语句,编译会选择一系列分支。
让我们尝试相同的示例,但每个 break
都替换为 continue
:
int func(unsigned int num, int iters) {
for (; iters > 0; iters--) {
switch (num) {
case 0:
sinka();
continue;
... [16 lines omitted] ...
}
}
}
您现在可能已经猜到了,the results are identical - 用于这个 特定的编译器和目标。 continue 语句和 break 语句意味着完全相同的控制流,所以我希望这对于大多数启用优化的体面编译器都是如此。
关于虚拟机的 C++ For 循环优化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35490572/
我一直在尝试弄清VMware是如何工作的(特别是在安装Linux时),我有两个问题: 当VMware遇到push cs这样的命令时会发生什么?特别是cs,因为其特权级别为0,而VMware以1特权级别
我正在尝试将 vim 配置为我的主要编码程序。我已经想出了如何编译单个文件,但是当我从 vim 中执行程序时,我不断收到 127 错误代码。我的盒子上有 a 别名为 ./a.out,但是当我从 vim
我正在尝试将 vim 配置为我的主要编码程序。我已经想出了如何编译单个文件,但是当我从 vim 中执行程序时,我不断收到 127 错误代码。我的盒子上有 a 别名为 ./a.out,但是当我从 vim
想知道有没有什么javascript虚拟机是你用过的或者有什么想法的! 我不是在谈论用于 chrome 的 V8 等浏览器的 javascript 引擎,我想在 linux 服务器机器上执行 java
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 10年前关闭。 Improve this qu
我正在查找 Azure 中存储帐户的用途。因为我有一个问题。 我的帐户仅限于 1 个存储帐户,显然我已经在使用它,但我不知道为什么,我认为我不需要它。 我有一台带有云服务和存储帐户的虚拟机。我想创建另
Error - JVM - BlackBerry 9800 Simulator --------------------------------------- JVM: could not open
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 9
这是我的情况 我需要配置linux系统,因为路由器和客户端也在虚拟机中.. 系统A eth0:从isp获取ip(在VM ware中配置为Bidge) eth1: DEVICE=eth1 BOOTPRO
我知道 BEA 正在开发不需要底层操作系统的 LiquidVM,但想知道开源社区中是否有人正在开发类似的东西。 理想情况下,我想找到一个实现,其中 VM 直接由操作系统引导加载程序加载。 最佳答案 与
Linux系统下安装Vmware教程 由于项目需要,要在Linux下虚拟一个Windows,经过查找些资料,发现可一用VMware来实现,当然还有其他一些虚拟机可以使用如Win4lin,bochs
我正在使用虚拟机进行开发,但是每次我需要一个新的 VM 时,我都会复制文件并创建一个新服务器,但是我需要一个新的服务器名称才能将其添加到我们的网络中。 重命名服务器后,Sharepoint 站点有很多
如果 Cassandra 和代码在同一台机器上,则以下代码有效: using System; using Cassandra; namespace CassandraInsertTest {
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 3年前关闭。 Improve this qu
我正在将我的 Web 应用程序 try catch 异常错误跟踪消息转储到 Web 服务器上的 C:\Temp 文件夹但是当我的 web 应用程序位于 azure 上时,我希望在 azure VM c
我们为客户提供桌面 ERP 软件。该软件安装在 Azure 虚拟机中。每个公司都有自己的数据库文件。我需要优化性能,但我有些怀疑无法找到回应。例如,对于 2 个公司: 1-购买 2 台小型 VM(2
我试图将 Azure 上的虚拟机的网络号地址更改为与 Azure 池上的另一个虚拟机位于同一网络中,一旦我单击网卡上的“保存”,它就会卡住并无法通过远程桌面或任何其他方式。 请帮忙。 最佳答案 切勿尝
是否可以在 Azure 上设置虚拟机并使该虚拟机的同一实例对多个用户可见? 我们是 ISV。我们的用户分散在全局。我们希望使用 Azure 虚拟机来指导用户设置我们的软件。理想情况下,我们的帮助台将在
我使用 Ubuntu 镜像创建了一个虚拟机,并从 Azure 库预加载了 Discourse。自动设置完成后,我可以看到虚拟机正在运行,但我无法连接到它以远程查看计算机。我没有看到任何设置可以为我解决
我是一名优秀的程序员,十分优秀!