c++ - AND 运算符 + 加法比减法快-6ren

c++ - AND 运算符 + 加法比减法快

转载作者：行者123 更新时间：2023-11-27 22:45:58

25

4

我测量了以下代码的执行时间:

volatile int r = 768;
r -= 511;

volatile int r = 768;
r = (r & ~512) + 1;

组装:

mov     eax, DWORD PTR [rbp-4]
sub     eax, 511
mov     DWORD PTR [rbp-4], eax

mov     eax, DWORD PTR [rbp-4]
and     ah, 253
add     eax, 1
mov     DWORD PTR [rbp-4], eax

结果:

Subtraction time: 141ns   
AND + addition: 53ns

我已经多次运行该代码段并获得一致的结果。
有人能解释一下为什么即使 AND + 加法版本多了一行汇编也会出现这种情况吗？

最佳答案

您关于一个片段比另一个片段更快的断言是错误的。
如果您查看代码:

mov     eax, DWORD PTR [rbp-4]
....
mov     DWORD PTR [rbp-4], eax

您会看到运行时间主要由内存加载/存储决定。
即使在 Skylake 上，这也至少需要 2+2 = 4 个周期。
sub 的 1 个周期或 and bytereg/add full reg 的 3^*) 周期简单地消失在内存访问时间中。< br/>在 Core2 等较旧的处理器上，对同一地址执行加载/存储对最少需要 5 个周期。

很难为如此短的代码序列计时，应注意确保您拥有正确的方法。
您还需要记住 rdstc 在 Intel 处理器上不准确，并且会乱序启动。

If you use proper timing code like :

.... x 100,000    //stress the cpu using integercode in a 100,000 x loop to ensure it's running at 100%
cpuid             //serialize instruction to make sure rdtscp does not run early.
rdstcp            //use the serializing version to ensure it does not run late   
push eax
push edx
mov reg1,1000*1000   //time a minimum of 1,000,000 runs to ensure accuracy
loop:
...                  //insert code to time here
sub reg1,1           //don't use dec, it causes a partial register stall on the flags.
jnz loop             //loop
//kernel mode only!
//mov eax,cr0          //reading and writing to cr0 serializes as well.
//mov cr0,eax
cpuid                //serialization in user mode.
rdstcp               //make sure to use the 'p' version of rdstc.
push eax
push edx
pop 4x               //retrieve the start and end times from the stack.

运行时序代码 a 100x 并取最低循环计数。
现在，您可以在 1 或 2 个周期内进行准确计数。
您还需要为一个空循环计时并减去该循环的时间，以便您可以看到执行相关指令所花费的净时间。

如果你这样做，你会发现 add 和 sub 以完全相同的速度运行，就像自从8086.
这当然也是什么Agner Fog , the Intel CPU manuals , the AMD cpu manuals , 和 just about any other source可用的说。

*) and ah,value 需要 1 个周期，然后 CPU 由于部分寄存器写入而停止 1 个周期，add eax,value 需要另一个周期。

优化代码

sub     DWORD PTR [rbp-4],511

如果您不需要在其他地方重用该值，可能会更快，延迟在 5 个周期时很慢，但相互吞吐量是 1 个周期，这比您的任何一个版本都要好得多。

关于c++ - AND 运算符 + 加法比减法快，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42888338/

25

4

0

文章推荐： c++ - 复合赋值(乘法)

文章推荐： php - CSS 没有正确显示 .custom-logo，是 PHP 的问题吗？

文章推荐： html - CSS :hover Twitching

VBS教程：运算符-Or 运算符
Or 运算符对两个表达式进行逻辑“或”运算。 result = expression1 Or expression2 参数 result 任意数值变量。 expression1 任意
VBS教程：运算符-Not 运算符
Not 运算符对表达式执行逻辑非运算。 result = Not expression 参数 result 任意数值变量。 expression 任意表达式。说明下表显示如何
VBS教程：运算符-Is 运算符
Is 运算符比较两个对象引用变量。 result = object1 Is object2 参数 result 任意数值变量。 object1 任意对象名。 object2 任意
VBS教程：运算符-\ 运算符
\ 运算符两个数相除并返回以整数形式表示的结果。 result = number1\number2 参数 result 任意数值变量。 number1 任意数值表达式。 numbe
VBS教程：运算符-And 运算符
And 运算符对两个表达式进行逻辑“与”运算。 result = expression1 And expression2 参数 result 任意数值变量。 expression1
VBS教程：运算符-运算符(+)
运算符(+) 计算两个数之和。 result = expression1 + expression2 参数 result 任意数值变量。 expression1 任意表达式。 exp
Javascript + 运算符 vs - 运算符
我对此感到困惑snippet : var n1 = 5-"4"; var n2 = 5+"4"; alert(n1); alert(n2); 我知道 n1 是 1。那是因为减号运算符会将字符串“4”转
c++ - |运算符 ,++ 和 I 运算符
我想我会得到 12，而不是 7。 w++，那么w就是4，也就是100，而w++， w 将是 8，1000；所以 w++|z++ 将是 100|1000 = 1100 将是 12。我怎么了？ int
VBS教程：运算符-Xor 运算符
Xor 运算符对两个表达式进行逻辑“异或”运算。 result = expression1 Xor expression2 参数 result 任意数值变量。 expression1
VBS教程：运算符-Mod 运算符
Mod 运算符两个数值相除并返回其余数。 result = number1 Mod number2 参数 result 任意数值变量。 number1 任意数值表达式。 numbe
VBS教程：运算符-Imp 运算符
Imp 运算符对两个表达式进行逻辑蕴涵运算。 result = expression1 Imp expression2 参数 result 任意数值变量。 expression1 任
VBS教程：运算符-Eqv 运算符
Eqv 运算符执行两个表达式的逻辑等价运算。 result = expression1 Eqv expression2 参数 result 任意数值变量。 expression1 任
c++ - 时序运算符+、运算符-、运算符*和运算符/
我有一个运算符重载的简单数学 vector 类。我想为我的运算符(operator)获取一些计时结果。我可以通过计时以下代码轻松计时我的 +=、-=、*= 和/=: Vector sum; for(s
c++ - 用户定义的比较运算符(运算符>、运算符<等)
我是用户定义比较运算符的新手。我正在读一本书，其中提到了以下示例: struct P { int x, y; bool operator、运算符<等)，我们
sql - 标准 SQL bool 运算符 IS 与等于 (=) 运算符
在 SQL 的维基百科页面上，有一些关于 SQL 中 bool 逻辑的真值表。 [1] 维基百科页面似乎来源于 SQL:2003 标准。等号运算符 (=) 的真值表与 SQL:2003 草案中的 I
c++ - 奇怪的 c++ 运算符(运算符 unsigned short())
我遇到了一个奇怪的 C++ 运算符。 http://www.terralib.org/html/v410/classoracle_1_1occi_1_1_number.html#a0f2780081f
C++:如果我重载 new 运算符，我是否也必须重载 delete 运算符？
我正在阅读关于 SO 和 answers 中的一个问题，它被提到为: If no unambiguous matching deallocation function can be found, pr
python - 如何在不使用 * 运算符(或/运算符)的情况下递归地将两个正整数相乘？ .您可以使用加法、减法和位移
我偶然发现了这个解决方案，但我无法理解其中到底发生了什么。谁能解释一下! 据我了解，它试图通过计算一半的单元格然后将其加倍来计算 a*b 网格中的单元格数量。但是我无法理解递归调用。请不要建议其他解
Go学习笔记（6）Go基本类型&运算符
Go的基本类型布尔类型bool 长度：1字节取值：布尔类型的取值只能是true或者false，不能用数字来表示整型通用整型 int / uint（有符号 / 无符号，下面也类似）长度：根据运
JavaScript 运算符
在本教程中，您将学习JavaScript中可用的不同运算符，以及在示例的帮助下如何使用它们。什么是运算符？在JavaScript中，运算符是一种特殊符号，用于对运算数（值和变量）执行操作。例如，

首页

博学

6Ren·AI

商城

c++ - AND 运算符 + 加法比减法快