c++ - 在两个连续的 pragma omp for 的情况下隐式屏障 vs nowait-6ren

c++ - 在两个连续的 pragma omp for 的情况下隐式屏障 vs nowait

转载作者：塔克拉玛干更新时间：2023-11-02 23:20:36

24

4

查看文档here ，以下结构定义明确:

#pragma omp parallel          //Line 1
{
#pragma omp for nowait        //Line 3
  for (i=0; i<N; i++)
    a[i] = // some expression
#pragma omp for               //Line 6
  for (i=0; i<N; i++)
    b[i] = ...... a[i] ......
}

自从

Here the nowait clause implies that threads can start on the second loop while other threads are still working on the first. Since the two loops use the same schedule here, an iteration that uses a[i] can indeed rely on it that that value has been computed.

我很难理解为什么会这样。假设 第 3 行 是:

#pragma omp for

然后，由于在 第 6 行 之前有一个隐式屏障，下一个 for 循环将在 a 的所有索引处完全计算出值。但是，对于 第 3 行 中的no wait，它将如何工作？

假设，第 1 行 触发了 4 个线程，t1、t2、t3 和 t4。假设 N 为 8，第一个 for 循环中的索引划分为:

t1: 0, 4
t2: 1, 5
t3: 2, 6
t4: 3, 7

假设 t1 首先完成索引 0 和 4 并到达 第 6 行 现在到底发生了什么？如何保证它现在可以对相同的索引 0 和 4 进行操作，其中 a 值由它正确计算上一次迭代？如果第二个 for 循环访问 a[i+1] 会怎样？

最佳答案

你引用的 Material 是错误的。如果您将 schedule(static) 添加到两个循环，它就会变得正确 - 这保证了连续循环的线程之间索引的相同分布。默认计划是实现定义的，您不能假设它是static。引用标准:

Different loop regions with the same schedule and iteration count, even if they occur in the same parallel region, can distribute iterations among threads differently. The only exception is for the static schedule as specified in Table 2.5. Programs that depend on which thread executes a particular iteration under any other circumstances are non-conforming.

如果第二个 for 循环访问 a[i+1]，您必须绝对将屏障留在那里。

关于c++ - 在两个连续的 pragma omp for 的情况下隐式屏障 vs nowait，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53277030/

24

4

0

文章推荐： android - 适用于 Android 的 MSAL 无法执行 B2C 登录

文章推荐： linux - Bash 程序在 if 语句后挂起

文章推荐： android - 使用动态屏幕时如何防止内存泄漏？

parallel-processing - OMP : What is the difference between OMP PARALLEL DO and OMP DO (Without parallel directive at all)
好的，我希望以前没有问过这个问题，因为在搜索中很难找到。我查看了 F95 手册，但仍然觉得这很模糊: For the simple case of: DO i=0,99 END DO 我正
multithreading - omp 并行与 omp 并行 for
这两者有什么区别？ [一] #pragma omp parallel { #pragma omp for for(int i = 1; i < 100; ++i) {
multithreading - omp 并行与 omp 并行 for
这两者有什么区别？ [一] #pragma omp parallel { #pragma omp for for(int i = 1; i < 100; ++i) {
c - omp for 和 omp parallel 的区别
我有这段代码: #include #include int main(){ int i,j = 0 ; int tid; # pragma omp parallel pri
c - 为什么 OMP 任务运行速度比 OMP 慢？
刚开始接触OPENMP，想用它来求解波动方程，串口代码在这里: #include #include #include #include #define GRID_SZ 3000 #define
c++ - "omp single"和 "omp task"如何提供并行性？
我对 omp single 感到困惑和 omp task指令。我已经阅读了几个使用它们的例子。以下示例显示如何使用任务构造来处理链表的元素。 1 #pragma omp parallel 2 {
c - omp ordered 和 omp critical 之间的区别
我试图了解 omp ordered 和 omp critical 之间的区别。他们都没有相同的语义吗？每个线程中编写的代码都被串行执行，当一个线程处于有序/关键 block 中时，其他线程等待。我看不
c++ - omp 并行 block 外的 omp pragma
是否可以在 omp 并行 block 之外使用 omp pragma，如 critical、single、master 或 barrier？我有一个函数可以从 OMP 并行 block 调用，也可以不
c - 如何一起使用 omp parallel for 和 omp simd？
我想测试 #pragma omp parallel for 和 #pragma omp simd 一个简单的矩阵加法程序。当我分别使用它们时，我没有收到任何错误，而且看起来还不错。但是，我想测试使用它
基于任务的编程 : #pragma omp task versus #pragma omp parallel for
考虑: void saxpy_worksharing(float* x, float* y, float a, int N) { #pragma omp parallel for
parallel-processing - omp critical 和 omp single 之间的区别
我试图了解 #pragma omp critical 之间的确切区别和 #pragma omp single在 OpenMP 中: Microsoft 对这些的定义是: Single:让您指定应在其上
c++ - pragma omp parallel for 与 pragma omp parallel
在带有 openMP 的 C++ 中，两者之间有什么区别吗 #pragma omp parallel for for(int i=0; i
c++ - pragma omp for inside pragma omp master or single
我正在处理一些事情，试图让孤立工作发挥作用，并通过减少 #pragma omp parallel 的调用来减少开销。我正在尝试的是这样的: #pragma omp parallel default(n
c - 为什么 "omp parallel"和 "omp single"不相互抵消？ (开放MP)
在我学习 OpenMP 的过程中，我遇到了一个示例，其中的主要内容如下所示: int main(){ #pragma omp parallel #pragma omp sing
c++ - #pragma omp parallel 和 #pragma omp parallel for 之间的区别
我是 OpenMP 的新手，我一直在尝试运行一个使用 OpenMP 添加两个数组的程序。在 OpenMP 教程中，我了解到，在 for 循环上使用 OpenMP 时，我们需要使用 #pragma om
multithreading - 通过分离#omp parallel 和#omp for，减少OpenMP fork/join 开销
我正在阅读 Peter S. Pacheco 的《并行编程简介》一书。在第 5.6.2 节中，它对减少 fork/join 开销进行了有趣的讨论。考虑奇偶转置排序算法: for(phase=0; p
c++ - OpenMP #pragma omp for v/s #pragma omp parallel for之间的区别？
之间有什么区别: #pragma omp for {for_loop} 和 #pragma omp parallel for {for_loop} 最佳答案 #pragma omp par
openmp - '#pragma omp master' 与 '#pragma omp single' 相比有什么好处？
在 OpenMP 中 #pragma omp master 中的任何代码指令由单个线程(主线程)执行，在区域末尾没有隐含的屏障。 (见 section on MASTER directive in t
fortran - omp simd的多维数组对齐
如果我明白 aligned omp simd的条款构造，它指的是整个数组的对齐方式。它如何用于多维数组？认为 ni = 131; nj = 137; nk = 127 !allocates arr
C - 并行化循环 omp
我有一个问题:我必须使用 OMP 并行化这段代码。存在数据依赖问题，不知道如何解决。有什么建议么？ for (n = 2; n < N+1; n++) { dz = *(dynamic_d +

首页

博学

6Ren·AI

商城

c++ - 在两个连续的 pragma omp for 的情况下隐式屏障 vs nowait