gpt4 book ai didi

memory - 新的 Haswell AVX "gather"指令有哪些对齐限制?

转载 作者:行者123 更新时间:2023-12-02 04:48:09 29 4
gpt4 key购买 nike

我正在查看AVX programming referencenew Haswell instructions包括一些期待已久的“聚集”负载。但是,我无法弄清楚索引数据项的对齐限制是什么。引用文献的第 2.5 节“内存对齐”似乎应该在表 2.4 或 2.5 之一中列出各种 VGATHER* 指令...但事实并非如此。

背景:虽然收集指令支持的数据大小为 4 和 8 字节,但我的应用程序可以从将相邻 16 位数据值对收集加载到 DWORD 中受益。具有 2 字节标度的奇数索引将产生 2 字节对齐的 4 字节负载,并且从手册中我不清楚这是否会出错或无法按预期工作(我宁愿怀疑我运气不好,因为所有支持未对齐访问的指令中似乎有一个“U”)。

最佳答案

这是我第一次听说 AVX2。但我猜测内存对齐限制与当前在 Sandy Bridge 上使用新的 VEX 编码方案实现 AVX 没有什么不同。 IE。除非明确使用名称中带有 A 的对齐 VMOV 指令,否则不需要对齐。大多数指令允许以任何字节粒度对齐进行访问。

事实上,请参阅 Intel(R) Advanced Vector Extensions Programming Reference 第 35 页第 2.5 节这正是说明了这一点。

关于memory - 新的 Haswell AVX "gather"指令有哪些对齐限制?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6546275/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com