gpt4 book ai didi

c++ - 在不改变值(value)、性能的情况下多次访问位域?

转载 作者:塔克拉玛干 更新时间:2023-11-03 07:39:14 24 4
gpt4 key购买 nike

给定一个带有位域的结构,例如:

struct
{
long f0: 6;
long f1: 6;
long f2: 2;
long f3: 2;
} S;

以下代码之间是否存在性能差异:1-

const int f0=S.f0,f1=S.f1,....;
//multiple calculations that use f0,f1,...., for example
int x=f0*f0;

相比于2-

//multiple calculations that use S.f0,S.f1,... directly, for example
x=S.f0*S.f0

我问的不是过早的优化,但我想知道今天的编译器是否能够知道 f0,... 是否在程序的不同部分之间改变。

最佳答案

期待优化器的最高能力

这当然完全依赖于实现。但作为一般原则,您可以期望优化编译器在两种情况下生成类似的优化代码。

为什么?因为基本上,在许多 objective-c PU 上,使用位字段只需要对原始值进行一些二进制操作(右移和左移)。然后优化器可以优化这些表达式(例如优化冗余子表达式),就像表达式中的任何其他操作一样。

实际实验:

取顺序:

x=S.f0*S.f0;
y=S.f0*S.f1;

(相关部分)code generated GCC 8.3 是:

  1)  movzx   eax, BYTE PTR S[rip]     ; load 8 bit of data data and make it 16 bits
2) sal eax, 2 ; get rid of the 2 bytes to keep only the 6
3) sar al, 2
4) movsx edx, al ; clone the value in second register
5) mov eax, edx
6) imul eax, edx
7) mov DWORD PTR x[rip], eax

8) movzx eax, WORD PTR S[rip] ; load 16 bits
9) sal eax, 4 ; get rid of 4 bits (so remain 12)
10) sar ax, 10 ; get rid of 10 bits on other side (so remain 6 next)
11) movsx eax, al
12) imul eax, edx ; reuse register previously loaded
13) mov DWORD PTR y[rip], eax

现在换一种选择:

const int f0=S.f0,f1=S.f1;
x=f0*f0;
y=f0*f1;

你会得到 following code :

  1)  movzx   eax, BYTE PTR S[rip]
8) movzx edx, WORD PTR S[rip] ; but in another register
2) sal eax, 2
9) sal edx, 4 ; but other register
3) sar al, 2
10) sar dx, 10 ; but other register
4) movsx eax, al
11) movsx edx, dl ; but other register
5) mov ecx, eax ; but other register
6) imul ecx, eax ; but other register
12) imul eax, edx
7) mov DWORD PTR x[rip], ecx ; but other register
13) mov DWORD PTR y[rip], eax

其他实验表明,循环优化也是如此:编译器能够从循环中提取位域访问代码,并多次重复使用提取的值。

提示:为了测试,考虑到优化器的能力,你需要做一些小技巧,这样你的测试代码就不会得到优化。为此,我将 x 和 y 设置为易变的(以便在从未使用该值的情况下将它们写入事件)。我还用一个不存在的外部函数初始化了结构,这样编译器就不能进行常量传播。

当然,只有当编译器确定 S 在连续的表达式之间没有变化时,这才是正确的。如果编译器不能假定(例如,您使用引用或指向 S 的指针调用函数),则它必须每次都重新加载 S.fx,这使得它比初始加载到 const 值更慢。

关于c++ - 在不改变值(value)、性能的情况下多次访问位域?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55188807/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com