gpt4 book ai didi

c++ - 这种替代循环方式是否更有效?

转载 作者:太空狗 更新时间:2023-10-29 20:47:29 28 4
gpt4 key购买 nike

一个下雨的下午,我很无聊,想出了这个:

int ia_array[5][5][5]; //interger array called array

{
int i = 0, j = 0, k = 0;//counters
while( i < 5 )//loop conditions
{
ia_array[i][j][k] = 0;//do something
__asm inc k;//++k;

if( k > 4)
{
__asm inc j; //++j;
__asm mov k,0;///k = 0;
}
if( j > 4)
{
__asm inc i; //++i;
__asm mov j,0;//j = 0;
}
}//end of while
}//i,j,k fall out of scope

它在功能上等同于三个嵌套的 for 循环。但是在 for 循环中你不能使用 __asm 语句。您也可以选择不将计数器放在一个范围内,这样您就可以将它们重新用于其他循环。我已经查看了两者的反汇编,我的替代方案有 15 个操作码,嵌套的 for 循环有 24 个。因此它可能更快吗?假设我真正要问的是 __asm inc i;比++i 快;?

注意:我无意在任何项目中使用此代码,只是出于好奇。感谢您的宝贵时间。

最佳答案

首先,您的编译器可能会将 i、j 和 k 的值存储在寄存器中。

for (i = 4; i <=0; i--)效率更高比for(i = 0; i < 5; i++)因为 cpu 可以免费确定它执行的最后一个操作的结果是否为零 - 它不必明确地与 4 进行比较(参见 cmovz 指令)。

对于 x86 来说,执行更少的指令会导致更快的代码并不是这种情况。指令流水线有各种各样的问题,这些问题很快就会让程序员手工编写太多。把它留给编译器,它们现在已经足够高效了(虽然绝对不是最优的......但谁愿意等待数小时来编译他们的代码)。

您可以通过在每个实现中运行您的函数数十万次来自行检查,并检查哪个更快。检查你是否可以用

在 for 循环中编写 asm 指令
__asm {
inc j;
mov k, 0;
}

(我已经有一段时间没有这样做了)

附言享受使用 asm 的乐趣,它会非常有趣和有益!

关于c++ - 这种替代循环方式是否更有效?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5493819/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com