c++ - 使用 AVX 寄存器 union 类成员以减少内存访问？-6ren

c++ - 使用 AVX 寄存器 union 类成员以减少内存访问？

转载作者：行者123 更新时间：2023-11-30 02:36:40

25

4

如果我有一个包含指针、 float 、 double 、int32 和 int16 的混合类(或结构)，我能否将该类与 AVX 寄存器 union ，然后通过 union 访问数据以强制编译器加载数据都在一起？

我正在尝试减少内存负载。

最佳答案

你可以做到，而且它会起作用(如果 struct 足够小)，但最终不会更快。除非您只想将整个结构复制为 32 字节的 block 。

如果您分别加载所有成员，那么您会在汇编中看到许多加载指令，例如 mov eax, [esi + 10h]。看来您想减少这些指令的数量。

您确实可以将它们加载为 __m256 类型的一个 AVX 值，然后您将只看到一条指令，如 vmovaps ymm0, [esi]。但是，该加载的结果将在 256 位 YMM 寄存器中。您将无法免费访问此寄存器的部分内容。

XMM 和 YMM 寄存器主要充当大数据 block ，您可以轻松地对 32 位整数进行 8 宽加法，但您无法快速访问这些 256 位 block 的任意部分。您仍然可以尝试提取 YMM 寄存器的一部分，但它需要额外的指令(至少与标量版本中的 mov-s 一样多)，因此生成的代码会更慢。

如果你真的想提取部分 AVX 寄存器，请务必在你的结构上使用 #pragma pack 并手动对齐其数据成员，否则成员的偏移量可能因编译器和位数。

您可能关心的另一件事是实际内存事务的数量。您可能认为一个 256 位加载比许多单独的 32 位和 16 位加载更快。在我看来，这是不正确的:内存是在缓存行粒度上运行的。每个 64 字节的内存块都是一个缓存行，处理器只能加载整个缓存行。在这两种情况下，将加载相同数量的缓存行，因此内存访问不会变得更快。

关于c++ - 使用 AVX 寄存器 union 类成员以减少内存访问？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32462762/

25

4

0

文章推荐： c++ - 错误 : invalid use of incomplete type (Maybe a definition issue)

文章推荐： c++ - 原子int集合的线程安全

文章推荐： c++ - C++ 中成员的枚举成员，或替代

文章推荐： C++ 获取所有正在运行的进程及其名称

c - 为 union 分配内存以及 union 指针和指针 union 之间的区别
自从我的问题here无法自信地回答，我在这里再次询问，希望有人确切知道: 指向 union 的指针和包含指向其元素的指针的 union 之间有什么区别(除了语法之外)吗？ this中生成的程序集示例是
c - union 内的 union
在 C 语言中，是否可以在另一个 union 体中定义一个 union 体？如果不是，为什么不可能？或者如果可以，可以在哪里使用？最佳答案假设您要定义: union myun { int x;
c - union 中的 union
在 C 中，是否可以在另一个 union 中定义一个 union ？如果不是，为什么不可能？或者如果是，它可以在哪里使用？最佳答案假设你想定义: union myun { int x; s
c - union 内的无名 union
我正在阅读一些代码并发现如下内容: typedef union { int int32; int boolean; time_t date; char *string;
lua - 为什么不能使用Set:union()代替Set.union？
我正在学习Lua，我更愿意使用冒号（:）作为方法。不幸的是，它并非在所有地方都有效。看我的代码：设置= {} 本地mt = {} 函数Set：new（m）本地集= {} setmetatable（
sql - 在同一查询中使用 UNION 和 UNION ALL
我遇到了一些性能问题，我有如下查询: SELECT * FROM Foo UNION SELECT * FROM Boo UNION SELECT * FROM Koo 我确信 Koo 不会返回任何重
c++ - 将C union 转换为C++ union
This question already has answers here: C++ Structure Initialization (16个答案) 上个月关闭。我正在尝试将一些用于嵌入式目标的
sql - UNION 和 UNION ALL 有什么区别？
UNION 和 UNION ALL 有什么区别？最佳答案 UNION 删除重复记录(结果中的所有列都相同)，UNION ALL 则不会。使用 UNION 而不是 UNION ALL 时会影响性能，
sql - Union - 仅删除由 Union 创建的重复项
我想在两个表上使用联合运算符。我希望结果集消除由联合创建的重复值，但不消除表中预先存在的重复值。考虑这段代码... select b from (values (1), (2), (2
Tsql，union 改变结果顺序，union all 不
我知道 UNION 会删除重复项，但即使没有重复项也会更改结果顺序。我有两个 select 语句，任何地方都没有 order by 语句我想将它们合并或不合并(全部) 即 SELECT A UNI
我可以为一个 union 成员分配一个值并从另一个 union 成员那里读取相同的值吗？
基本上，我有一个 struct foo { /* variable denoting active member of union */ enum whichmembe
mysql - 组合多个选择而不使用 Union 或 Union All
我有一个大规模查询，用于对许多表(每个表有数千行)执行 UNION ALL，然后在返回之前输出到临时表。旧形式: SELECT * FROM (SELECT `a` AS `Human rea
sql - UNION 和 UNION ALL 有什么区别？
UNION 和 UNION ALL 有什么区别？最佳答案 UNION 删除重复记录(结果中的所有列都相同)，UNION ALL 则不会。使用 UNION 而不是 UNION ALL 时会影响性能，
c++ - 对象 union 与指针 union
如果我有两个 union 行结构: struct A { A() {} ~A() {} union { vector vi; vector db
关于另一个 union 中 union 字段的编译错误
考虑下面的代码，我已经写了: #include #include union myAccess { uint16_t access16; struct { uint
可以将 union 内的对齐结构强制转换为 union 以访问对齐字段吗？
我想弄清楚你从 C99 中对齐变量的地役权中得到了什么: Exception to strict aliasing rule in C from 6.5.2.3 Structure and union
php - UNION 与 UNION ALL 的性能对比
我正在通过 UNION 或 UNION ALL 从多个表中选择一列外键。当重复无关紧要时，通常建议使用 UNION ALL 而不是 UNION 来解决性能问题。但是，在我的调用 PHP 脚本中，循环
c++ - 为什么 union 静态成员不存储为 union ？
在 C++ 中，union 可以包含静态成员，在类的情况下，这些成员属于一个类，因此对所有对象都是通用的。 union U { long l; int i; static long
c++ - 匿名 union 和普通 union
任何人都可以提及普通和匿名 union (或结构)之间的区别吗？我刚找到一个: 不能在匿名 union 中定义函数。最佳答案您不需要点运算符“.”访问匿名 union 元素。 #include
c - union 成员如何拥有指向 union 实例的指针？
我可能把这个复杂化了.. 我正在尝试在 Arduino 上用 C 语言为嵌入式应用程序制作一个相当可重用的分层菜单系统。我有结构来表示不同类型的菜单项，包括那些子菜单，以及这些菜单项的 union 是

首页

博学

6Ren·AI

商城

c++ - 使用 AVX 寄存器 union 类成员以减少内存访问？