gpt4 book ai didi

x86 - 使用 SSE 加载非连续 float

转载 作者:行者123 更新时间:2023-12-04 05:00:55 26 4
gpt4 key购买 nike

是否有英特尔 SSE 指令可以从(非连续)均匀间隔的内存地址加载浮点数?

例如给定一个数组 A = {0, 1, 2, 3 .... n} , 我想一次性加载到 128 位寄存器 {A[0], A[4], A[8], A[12]} ,其次是{A[5], A[9], A[13], A[17]}

最佳答案

在这种用例中,您通常会加载多个连续向量,然后使用例如将它们排列成所需的排列。 pshufdpunpckldq等等。

请注意,在 Haswell 及以后的 AVX2 中,收集了加载指令(例如 _mm_i32gather_ps),这也可能值得考虑。

关于x86 - 使用 SSE 加载非连续 float ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16154120/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com