- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在 x86-64 SIMD 指令名称中,以及 intrinsic可用于从 C/C++ 访问它们的函数,您会发现术语 shuffle(例如, _mm_shuffle_epi32
)和置换(例如, _mm_permute_pd
)。
从表面上看,它们似乎都用于数据移动的东西。有什么不同?
最佳答案
我没有在 x86 之外寻找灵感。我认为这里没有任何标准约定。
我认为他们只是在某个时间点从“洗牌”切换到“置换” SSSE3之间pshufb
和 AVX1 vpermilps/pd
/vperm2f128
. AVX 之前的所有内容都称为“shuffle”,之后的所有内容都称为“permute”。
(SSE4.x 没有引入任何名为“shuffle”或“permute”的指令,只是 pinsrd
/pextrd
和其他操作数大小是 SSE4.1 添加的主要 shuffle)
有 2 个异常(exception) , 不包括 vshufps
的 VEX/EVEX 编码, vpshufd
, 等等。:
AVX512F VSHUFF32X4
(以及 64x2 和整数版本)具有即时控制的 128 位粒度 channel 混洗 与 vshufps
的设计相同 :目标的低半部分从第一个源中选择元素,高半部分从第二个源中选择。例如_mm512_shuffle_i64x2(__m512i a, __m512i b, int imm);
这种命名有助于记住 shuffle 控件的工作原理。 有 4 个输出 channel ,只有 4x 2 位选择器的空间,而不是 4x 3 位选择器。 256 位操作数大小版本仍然具有相同的限制,因此它仅使用立即数的低 2 位,例如 shufpd
.
AVX512BITALG VPSHUFBITQMB
就像 vpmultishiftqb
(并行位域提取)+ 向量-> 掩码(如移动掩码)。因此它可以选择输入的每个 qword 块中的任何 8 位。
AVX512 256 位粒度操作目前仅以 VEXTRACTF32x8 和 VINSERTF32x8 之类的名称存在,而不是 shuf 或 perm。
就shuffle 和permute 而言,内在名称确实匹配指令助记符,但是当助记符具有它时,可能会遗漏“inlane”,这需要跨车道版本也不同。 (例如 AVX1 vpermilps
= _mm_permute_ps
imm8 或 _mm_permutevar_ps
__m128i 控制与 AVX2 vpermps
= _mm256_permutexvar_ps
;不能直接控制,但 vpermpd
英特尔的内在指南仅列出 _mm256_permutevar8x32_ps
为 vpermps
,而 ISA 引用手册仅列出 permutexvar
.我假设大多数编译器都支持较旧的 permutexvar
姓名。无论如何,奇怪的选择,8x32 听起来像是一条 AVX512 指令(带有每个元素的掩码);也许这就是新的内在名称的来源。
我没有注意到其他模式。 我们可以轻松排除以下所有假设 :
pshufd xmm, xmm/mem, imm
) 与就地洗牌 ( pshufb data, idx
或 shufps xmm, xmm, imm
) vpermilps
与 AVX2 vpermps
)pshufd
中的工作方式相同和
vpermq
-即时。但不像“棘手”
vshuff32x4
案例,两者
pshufd
和
vpermq
以显而易见的方式工作,因此无需对另一个助记符进行类比。另外,
“pshuf”与“shuf”或“perm”相比有点尴尬,所以我明白为什么他们想要其他东西来打包整数。
shufps
, 由 Pentium III (Katmai) 与 MMX2 同时推出
pshufw mm, mm, imm8
.
punpckl/h
各种大小的洗牌。
vshuff32x4
助记符在 AVX512 的东西中,在我认为他们已经切换到将所有东西都称为“烫发”之后。)
关于x86 - shuffle 和 permute 有什么区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57504420/
平时很少在jquery中用到this。查看代码时发现用到了,就调试出this的值,心想原来如此。还是挺有用的。这里总结一下this与$(this)的区别和使用。 $(this)生成的是什么?
使用单例类和应用程序范围的托管 bean 来保存应用程序数据有区别吗? 我需要查找某些 JNDI 资源,例如远程 bean 接口(interface),因此我为自己编写了一个单例来缓存我的引用并且只允
如果您仔细查看包含的图片,您会注意到您可以使用 Eclipse IDE 重构 Groovy 代码并将方法转换为闭包,反之亦然。那么,闭包到底是什么,它与方法有什么不同呢?有人可以举一个使用闭包的好例子
vagrant box repackage有什么区别( docs ) 和 vagrant package ( docs )? 我意识到 vagrant package仅适用于 VirtualBox 提
我想看看是否有人可以解释为什么以下代码适用于 valueOf 但不适用于其他代码。 import java.math.BigDecimal; public class Change { publ
这个问题已经有答案了: 已关闭12 年前。 Possible Duplicates: What is Closures/Lambda in PHP or Javascript in layman te
This question already has answers here: Vagrant, Docker, Puppet, Chef (3个答案) 2年前关闭。 docker和chef有什么共同
以下代码在95%的机器上产生相同的输出,但是在几台机器上却有所不同。在 Debug模式下,输出: Changing from New to Fin OK 但在 Release模式下: Changing
////Creating Object var Obj; // init Object Obj= {}; 它们之间有什么区别两个? 有没有可能把它变成一个单行? 这样使用有什么好处吗?
我想找出定时器服务之间的区别。我应该使用哪个以及何时使用。我正在使用 Jboss 应用服务器。 1) java.ejb.Schedule。 @Schedule注解或配置自xml。 2) javax.e
我发现在 C++ 中可以通过三种不同的方式将对象传递给函数。假设我的类(class)是这样的: class Test { int i; public: Test(int x);
有什么区别。 public class Test { public static void main(String args[]) { String toBeCast = "c
如果我有一列,设置为主索引,设置为INT。 如果我不将其设置为自动递增,而只是将唯一的随机整数插入其中,与自动递增相比,这是否会减慢 future 的查询速度? 如果我在主索引和唯一索引为 INT 的
这两种日期格式有什么区别。第一个给出实际时间,第二个给出时间购买添加时区偏移值。 NSDateFormatter * dateFormatter = [[NSDateFormatter alloc]
如果有一个函数,请说foo: function foo() { console.log('bar'); } 那么在 JavaScript 中,从另一个函数调用一个函数有什么区别,如下所示: f
关闭。这个问题是opinion-based 。目前不接受答案。 想要改进这个问题吗?更新问题,以便 editing this post 可以用事实和引文来回答它。 . 已关闭 4 年前。 Improv
代码是什么: class Time { private: int hours; int minutes; int seconds; pu
我知道这是非常基本的,但有人介意解释一下这两个数组声明之间的区别吗: #include array myints; ...和: int myints[5]; ...以及为什么 myints.size
我学会了如何根据 http://reference.sitepoint.com/css/specificity 计算 css 特异性但是,基于this reference,我不明白伪类(来自c)和伪元
为什么在运行 2) 时会出现额外的空行?对我来说 1 就像 2。那么为什么 2) 中的额外行? 1) export p1=$(cd $(dirname $0) && pwd) #
我是一名优秀的程序员,十分优秀!