gpt4 book ai didi

c++ - 什么是未对齐的临时文件?

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:59:11 25 4
gpt4 key购买 nike

answer在谈论 const T& 时提到它可能由于“未对齐的临时对象”而变慢。什么是未对齐的临时文件,我会在代码中的什么地方遇到它?

答案是:

Taking const T& could be slower due to misaligned temporaries and the cost of indirection.

然后是两条评论:

Even if there are no performance penalties due to misalignment, the mere fact that a reference is implemented as a pointer requires the value to be stored in main memory, which can be between one (L1 cache) and ten (page fault) orders of magnitude slower than passing by register.

这并没有解释什么是未对齐的临时文件。指针可以指向未对齐的地址,但这并不能解释什么是未对齐的临时地址。下一条评论未得到解决:

Why would temporaries be unaligned? Unless you stray into undefined behavior, all objects in C++ are by definition aligned.

最佳答案

在严格的 C++ 中,任何对象都不能错位 [basic.align]/1 :

Object types have alignment requirements ([basic.fundamental], [basic.compound]) which place restrictions on the addresses at which an object of that type may be allocated.

无论是否临时,对象都不能错位。也就是说,未对齐的对象用于低级代码,但此类代码涉及非标准 C++ 代码(例如,参见 Linux-kernel-doc/unaligned-memory-access.txt)。您可以尝试以这种方式将未对齐(不存在)的对象传递给函数:

void f(const int& x);
void g(long x){
f(*reinterpret_cast<const int*>(reinterpret_cast<const unsigned char*>(&x)+1));
}

在这样的代码中,会导致未定义的行为,编码器清楚地向我们展示了他没有遵循标准,将 int 对象传递给 f 不存在。所以我们处于另一个领域,也许在这个领域中,可以将此 int 对象称为临时对象。这样的代码确实存在。

第一个讨论缓存未命中的评论需要了解调用约定的知识(如何在程序集级别传递参数)。在所有 ABI 上,引用都是通过指向被引用对象的指针传递的。所以引用的对象必须在内存中复制。 g 的参数 x 最初位于寄存器中,将被复制到内存中的内存位置,该位置将传递给 f。下面是 gcc 生成的 g 的 AMD64 汇编代码:

//the argument x of g is in register rdi.
g(long):
sub rsp, 24
mov QWORD PTR [rsp+8], rdi //x is copied on to the stack
lea rdi, [rsp+9] //the misaligned pointer is stored in
//the first argument of f
call f(int const&)
add rsp, 24
ret

传递给 f 的参数存在于内存中,当后者的值被访问时,该访问可能会产生缓存未命中,并且可能比正确对齐时更多的缓存未命中,因为 int 对象可能分布在两个缓存行上(参见 rsp+9)。因此,如果对象本来可以通过寄存器传递,则通过引用传递参数不是最优的(也就是说,如果对象是简单可复制的并且足够小 - 在窗口 x86_64 上为 8 字节,对于 x86_64 的 Sys V abi 为 16)。如果对象未对齐,这是最糟糕的。

下面是当 f 按值获取其参数时生成的更好的代码:

void f(int x);
void g(long x){
f(*reinterpret_cast<const int*>(reinterpret_cast<const unsigned char*>(&x)+1));
}

并且生成的程序集是完美的:

g(long):
sal rdi, 24 //no memory access just a right shift right and left shift
sar rdi, 32
jmp f(int) //tail call a ret from f will jump directly
//to g caller!

关于c++ - 什么是未对齐的临时文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53030000/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com