gpt4 book ai didi

simd - _mm_load1_ps 的 AVX 256 位等效项

转载 作者:行者123 更新时间:2023-12-02 11:12:32 24 4
gpt4 key购买 nike

使用 SSE,您可以使用内在的 _mm_load1_ps() 将内存中的单个 float 加载到 __m128 的所有 4 个插槽中

当使用 256 位宽 SIMD 和 AVX 时,似乎没有 _mm256_load1_ps() 将单个 float 从内存加载到向量的所有 8 个槽中。

为什么会出现这样的遗漏?解决这个问题的最佳方法是什么?

或者更好:有没有办法将单个 float 加载到向量的目标槽 0..7 中?

最佳答案

_mm256_broadcast_ss就是您正在寻找的。

关于simd - _mm_load1_ps 的 AVX 256 位等效项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17099139/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com