gpt4 book ai didi

32 位 Intel 处理器上的内存对齐

转载 作者:IT王子 更新时间:2023-10-28 23:31:14 28 4
gpt4 key购买 nike

Intel 的 32 位处理器(例如 Pentium)具有 64 位宽的数据总线,因此每次访问获取 8 个字节。基于此,我假设这些处理器在地址总线上发出的物理地址始终是 8 的倍数。

首先,这个结论正确吗?

其次,如果它是正确的,那么应该在 8 字节边界上对齐数据结构成员。但是我看到人们在这些处理器上使用 4 字节对齐。

他们如何有理由这样做?

最佳答案

通常的经验法则(直接来自 Intel 和 AMD 的优化手册)是每种数据类型都应该按照自己的大小对齐。 int32 应该在 32 位边界上对齐,int64 在 64 位边界上对齐,依此类推。 char 适合任何地方。

另一个经验法则当然是“编译器已被告知对齐要求”。您无需担心,因为编译器知道添加正确的填充和偏移量以允许有效地访问数据。

唯一的异常(exception)是使用 SIMD 指令时,您必须在大多数编译器上手动确保对齐。

Secondly, if it is correct, then one should align data structure members on an 8 byte boundary. But I've seen people using a 4-byte alignment instead on these processors.

我不明白这有什么不同。 CPU 可以简单地对包含这 4 个字节的 64 位 block 发出读取。这意味着它要么在请求的数据之前或之后获得 4 个额外的字节。但在这两种情况下,它只需要一次读取。 32 位宽数据的 32 位对齐确保它不会跨越 64 位边界。

关于32 位 Intel 处理器上的内存对齐,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1054657/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com