gpt4 book ai didi

c++ - c=c+a*b 的 OpenMP 4 simd 矢量化

转载 作者:太空狗 更新时间:2023-10-29 21:16:41 24 4
gpt4 key购买 nike

我不知道 OpenMP 4 是否支持这个 for 循环。使用和不使用 pragma 的速度是一样的。

#pragma omp  for simd
for (size_t i = 0; i < col; i++)
{
C[i] += A[i]* B[i];
}

最佳答案

编译指示无效的原因(我猜)是双重的:

  • 代码在没有simd 指令的情况下已经向量化;和
  • 代码无论如何都是内存限制的,因此添加更多线程来计算它不会产生太大差异,除非它可以让您访问更多内存带宽。参见 this excellent answer了解更多详情。

关于c++ - c=c+a*b 的 OpenMP 4 simd 矢量化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34450082/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com