gpt4 book ai didi

sse - 在整数 SSE 寄存器中移动更高或更低 64 位的最快方法

转载 作者:行者123 更新时间:2023-12-04 13:43:41 32 4
gpt4 key购买 nike

仅将较高或较低 64 位从整数 SSE 寄存器移动到另一个的最快方法是什么?使用 SSE 4.1,可以使用单个 pblendw 来完成。指令(_mm_blend_epi16)。但是旧的 SSE 版本呢?转移和拆包? AND 和 OR? movsd尽管有旁路延迟?

密切相关的问题:Best way to shuffle 64-bit portions of two __m128i's

最佳答案

要将低 64 位从 src 移动到 dst,保留 dst 的高 64 位:

movsd dst, src

要将高 64 位从 src 移动到 dst,保留 dst 的低 64 位:
shufps dst, src, E4h

绕过延迟通常只会增加延迟,而不是调度或执行或退休资源,因此它们通常只是比较其他等效序列时的一个问题(即,如果有一个单指令等价物留在整数域中,您更愿意使用它用于整数运算)。

关于sse - 在整数 SSE 寄存器中移动更高或更低 64 位的最快方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31184375/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com