c++ - pragma omp 与 for 循环并行的行为-6ren

c++ - pragma omp 与 for 循环并行的行为

转载作者：塔克拉玛干更新时间：2023-11-03 07:04:01

25

4

我似乎不完全理解带有嵌套 for 循环的 openmp 并行构造的行为。考虑以下代码:

std::size_t idx;
std::size_t idx2;
omp_set_num_threads( 2 );

#pragma omp parallel default(shared) private(idx, idx2)
{

  for(std::size_t idx=0;idx<3;idx++)
  {
    for(std::size_t idx2=0;idx2<4;idx2++)
    {
      LOG("From thread "+std::to_string(omp_get_thread_num())+" idx "+std::to_string(idx)+" idx2 "+std::to_string(idx2));
    }
  }
}

这会产生以下输出:

From thread 0 idx 0 idx2 0
From thread 1 idx 0 idx2 0
From thread 0 idx 0 idx2 1
From thread 1 idx 0 idx2 1
From thread 0 idx 0 idx2 2
From thread 1 idx 0 idx2 2
From thread 0 idx 0 idx2 3
From thread 1 idx 0 idx2 3
From thread 0 idx 1 idx2 0
From thread 1 idx 1 idx2 0
From thread 0 idx 1 idx2 1
From thread 1 idx 1 idx2 1
From thread 0 idx 1 idx2 2
From thread 1 idx 1 idx2 2
From thread 0 idx 1 idx2 3
From thread 1 idx 1 idx2 3
From thread 0 idx 2 idx2 0
From thread 1 idx 2 idx2 0
From thread 0 idx 2 idx2 1
From thread 1 idx 2 idx2 1
From thread 0 idx 2 idx2 2
From thread 1 idx 2 idx2 2
From thread 0 idx 2 idx2 3
From thread 1 idx 2 idx2 3

上面似乎发生的事情是分配了 2 个线程来执行两个嵌套循环，结果它们产生了上面的输出(总共 2*3*4=24 条日志消息)，这很简单。

但现在考虑以下代码，其中内部 for 循环被声明为 pragma omp for

std::size_t idx;
std::size_t idx2;    
omp_set_num_threads( 2 );

#pragma omp parallel default(shared) private(idx, idx2)
{

  for(std::size_t idx=0;idx<3;idx++)
  {
    #pragma omp for
    for(std::size_t idx2=0;idx2<4;idx2++)
    {
      LOG("From thread "+std::to_string(omp_get_thread_num())+" idx "+std::to_string(idx)+" idx2 "+std::to_string(idx2));
    }
  }
}

这会产生以下 3*4=12 条日志消息:

From thread 0 idx 0 idx2 0
From thread 1 idx 0 idx2 2
From thread 0 idx 0 idx2 1
From thread 1 idx 0 idx2 3
From thread 0 idx 1 idx2 0
From thread 1 idx 1 idx2 2
From thread 0 idx 1 idx2 1
From thread 1 idx 1 idx2 3
From thread 0 idx 2 idx2 0
From thread 0 idx 2 idx2 1
From thread 1 idx 2 idx2 2
From thread 1 idx 2 idx2 3

我本来希望再次将两个线程分配给对应于两个内部 for 循环的代码，并再次获得 24 条输出消息。为什么这两种情况下的输出不同？

最佳答案

第一种情况#pragma omp parallel在每个线程上运行一次整个并行区域。这意味着两个线程将完全运行两个 for 循环，因此每个线程应生成 4*3=12 行输出。

在第二种情况下，内部 #pragma omp for 告诉计算机 idx2 上的内部 for 循环应该在可用线程之间拆分。因此，不是两个线程都执行从 0 到 idx2 的内部循环，而是内部循环的每次迭代都只执行一次。

在第二个输出中，我们应该看到 idx2 的所有值都为 idx 的每个值打印一次，并且来自恰好可用的任何线程。

例如如果 idx 只能为零，则输出可能类似于:

From thread ? idx 0 idx2 0
From thread ? idx 0 idx2 1
From thread ? idx 0 idx2 2
From thread ? idx 0 idx2 3

? 表示它可以是任何可用的线程。

关于c++ - pragma omp 与 for 循环并行的行为，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54016089/

25

4

0

文章推荐： c++ - 在循环初始化中使用 constexpr 和 static？

文章推荐： c++ - 如何使用 for 循环将元素添加到 vec 或 rowvec？

文章推荐： c++ - 在 vector 中找到最接近的值

gcc - 我应该在Xcode中使用 "#pragma GCC ..."还是 "#pragma clang ..."
我应该使用其中哪些忽略警告？ #pragma clang diagnostic ignored "-W" #pragma GCC diagnostic ignored "-W" 两者似乎都对我有用，但
c++ - #pragma start 和#pragma exit 的用例
#pragma startup and #pragma exit: These directives helps us to specify the functions that are needed
objective-c - #pragma 标记的意义是什么？为什么我们需要#pragma 标记？
Xcode 中 #pragma 标记的目的是什么？它们在 .m 文件中的位置是否重要？某些 #pragma 是否应该排在所有其他之前？他们必须在场吗？可以添加新标记吗？他们为什么会这样？是什么原因
macros - nim - 自定义宏/pragma 以获取完整模块但获取 "cannot attach a custom pragma"
我想使用 nim 访问完整模块(文件)的 AST。我发现，任何宏都可以用作自定义编译指示，所以我在文件 foo.nim 中做了这样的事情: import macros macro getAst(ast
基于任务的编程 : #pragma omp task versus #pragma omp parallel for
考虑: void saxpy_worksharing(float* x, float* y, float a, int N) { #pragma omp parallel for
c++ - pragma omp parallel for 与 pragma omp parallel
在带有 openMP 的 C++ 中，两者之间有什么区别吗 #pragma omp parallel for for(int i=0; i
c++ - #pragma warning(push) 没有#pragma warning(pop)
在 Visual Studio 2010 中使用 C++ native 解决方案。 #pragma warning (push) 用于 cpp 文件的开头，在所有包含之后。之后，#pragma war
c++ - 当 pragma for 中有 pragma for 时，OpenMP 中会发生什么情况？
在 #pragma omp parallel 的开头创建了一堆线程，然后当我们到达 #pragma omp for 时，工作负载被分配。如果这个 for 循环内部有一个 for 循环，并且我在它之前也
c++ - 如果#pragma push_macro 没有#pragma pop_macro 会发生什么？
使用#pragma pop_macro("int") #include using namespace std; #define int double void main() { int i
c++ - pragma omp for inside pragma omp master or single
我正在处理一些事情，试图让孤立工作发挥作用，并通过减少 #pragma omp parallel 的调用来减少开销。我正在尝试的是这样的: #pragma omp parallel default(n
c++ - #pragma omp parallel 和 #pragma omp parallel for 之间的区别
我是 OpenMP 的新手，我一直在尝试运行一个使用 OpenMP 添加两个数组的程序。在 OpenMP 教程中，我了解到，在 for 循环上使用 OpenMP 时，我们需要使用 #pragma om
c - #pragma unroll(0) 和#pragma unroll(1) 有区别吗？
我阅读了有关循环展开的文档。它解释说，如果将展开因子设置为 1，则程序将像使用 #pragma nounrolling 一样工作。但是，该文件不包括#pragma unroll(0) 案例..由于
c++ - #pragma pack(16) 和#pragma pack(8) 的效果总是一样吗？
我正在尝试使用 #pragma pack (n) 对齐数据成员.以下面为例: #include using namespace std; #pragma pack(8) // or (16) str
c - 为什么 GCC 编译器不支持#pragma startup 和#pragma exit 指令？
我是 C 语言的菜鸟，正在尝试学习 #pragma 预处理器指令。我在谷歌上查找并找到了这个链接:GeeksforGeeks Pragma Directive in C 在这个链接中，他们说 #pra
c++ - OpenMP #pragma omp for v/s #pragma omp parallel for之间的区别？
之间有什么区别: #pragma omp for {for_loop} 和 #pragma omp parallel for {for_loop} 最佳答案 #pragma omp par
.net - 语句 "#pragma managed(push, off)"和 "#pragma managed(pop)"是什么意思？
我正在查看一些 C++/CLI 代码，并且看到了很多这样的语句，主要是围绕 #includes。他们的意思是什么？我知道他们，根据 MSDN，Enable function-level control
openmp - '#pragma omp master' 与 '#pragma omp single' 相比有什么好处？
在 OpenMP 中 #pragma omp master 中的任何代码指令由单个线程(主线程)执行，在区域末尾没有隐含的屏障。 (见 section on MASTER directive in t
cuda - 是否有 NVCC 的 `#pragma nv_exec_check_disable` 和/或 `#pragma hd_warning_disable` 的任何文档？
一些项目使用 #pragma nv_exec_check_disable 和/或 #pragma hd_warning_disable 使 NVCC 的警告静音 warning: calling a
openmp - Intel 的 pragma simd 与 OpenMP 的 pragma omp simd
英特尔编译器允许我们通过以下方式对循环进行矢量化 #pragma simd for ( ... ) 但是，您也可以选择使用 OpenMP 4 的指令执行此操作: #pragma omp simd fo
c - #pragma init 和 #pragma fini 在 linux 上使用 gcc 编译器
我想构建一些代码，在加载共享库时调用一些代码。我以为我会这样做: #pragma init(my_init) static void my_init () { //do-something }

首页

博学

6Ren·AI

商城

c++ - pragma omp 与 for 循环并行的行为