gpt4 book ai didi

c++ - 慢异或运算符

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:21:50 29 4
gpt4 key购买 nike

编辑:确实,我的计时代码中有一个奇怪的错误导致了这些结果。当我修复我的错误时,智能版本如预期的那样更快结束。我的计时代码如下所示:

bool x = false;
before = now();
for (int i=0; i<N; ++i) {
x ^= smart_xor(A[i],B[i]);
}
after = now();

我已经完成了 ^= 来阻止我的编译器优化 for 循环。但我认为 ^= 以某种方式与两个 xor 函数进行了奇怪的交互。我更改了我的计时代码以简单地填写一个异或结果数组,然后在计时代码之外对该数组进行计算。那就是固定的东西。

我应该删除这个问题吗?

结束编辑

我定义了两个C++函数如下:

bool smart_xor(bool a, bool b) {
return a^b;
}

bool dumb_xor(bool a, bool b) {
return a?!b:b;
}

我的计时测试表明 dumb_xor() 稍微快一些(内联时 1.31ns vs 1.90ns,非内联时 1.92ns vs 2.21ns)。这让我很困惑,因为 ^ 运算符应该是单机操作。我想知道是否有人有解释。

程序集如下所示(未内联时):

    .file   "xor.cpp"
.text
.p2align 4,,15
.globl _Z9smart_xorbb
.type _Z9smart_xorbb, @function
_Z9smart_xorbb:
.LFB0:
.cfi_startproc
.cfi_personality 0x3,__gxx_personality_v0
movl %esi, %eax
xorl %edi, %eax
ret
.cfi_endproc
.LFE0:
.size _Z9smart_xorbb, .-_Z9smart_xorbb
.p2align 4,,15
.globl _Z8dumb_xorbb
.type _Z8dumb_xorbb, @function
_Z8dumb_xorbb:
.LFB1:
.cfi_startproc
.cfi_personality 0x3,__gxx_personality_v0
movl %esi, %edx
movl %esi, %eax
xorl $1, %edx
testb %dil, %dil
cmovne %edx, %eax
ret
.cfi_endproc
.LFE1:
.size _Z8dumb_xorbb, .-_Z8dumb_xorbb
.ident "GCC: (Ubuntu 4.4.3-4ubuntu5) 4.4.3"
.section .note.GNU-stack,"",@progbits

我在 Intel Xeon X5570 上使用 g++ 4.4.3-4ubuntu5。我用 -O3 编译。

最佳答案

我认为您没有正确地对代码进行基准测试。

我们可以在生成的程序集中看到您的smart_xor 函数是:

movl    %esi, %eax
xorl %edi, %eax

而你的 dumb_xor 函数是:

movl    %esi, %edx
movl %esi, %eax
xorl $1, %edx
testb %dil, %dil
cmovne %edx, %eax

很明显,第一个会更快。
如果不是,那么您遇到了基准测试问题。

因此,您可能想要调整基准测试代码...请记住,您需要运行大量调用才能获得良好且有意义的平均值。

关于c++ - 慢异或运算符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16241544/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com