gpt4 book ai didi

vectorization - _mm_broadcast_ss比_mm_set1_ps快吗?

转载 作者:行者123 更新时间:2023-12-04 03:35:05 24 4
gpt4 key购买 nike

这是代码吗

float a = ...;
__m256 b = _mm_broadcast_ss(&a)

总是比这段代码快
float a = ...;
_mm_set1_ps(a)



如果 a定义为 static const float a = ...而不是 float a = ...怎么办?

最佳答案

mm_broadcast_ss可能比mm_set1_ps快。前者转换为一条指令(VBROADCASTSS),而后者则使用多条指令进行模拟(可能是MOVSS,然后是随机播放)。但是,mm_broadcast_ss需要AVX指令集,而mm_set1_ps仅需要SSE。

关于vectorization - _mm_broadcast_ss比_mm_set1_ps快吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13218391/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com