gpt4 book ai didi

c++ - 在两个连续的 pragma omp for 的情况下隐式屏障 vs nowait

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:20:36 24 4
gpt4 key购买 nike

查看文档here ,以下结构定义明确:

#pragma omp parallel          //Line 1
{
#pragma omp for nowait //Line 3
for (i=0; i<N; i++)
a[i] = // some expression
#pragma omp for //Line 6
for (i=0; i<N; i++)
b[i] = ...... a[i] ......
}

自从

Here the nowait clause implies that threads can start on the second loop while other threads are still working on the first. Since the two loops use the same schedule here, an iteration that uses a[i] can indeed rely on it that that value has been computed.

我很难理解为什么会这样。假设 第 3 行 是:

#pragma omp for

然后,由于在 第 6 行 之前有一个隐式屏障,下一个 for 循环将在 a 的所有索引处完全计算出值。但是,对于 第 3 行 中的no wait,它将如何工作?

假设,第 1 行 触发了 4 个线程,t1、t2、t3t4。假设 N 为 8,第一个 for 循环中的索引划分为:

t1: 0, 4
t2: 1, 5
t3: 2, 6
t4: 3, 7

假设 t1 首先完成索引 04 并到达 第 6 行 现在到底发生了什么?如何保证它现在可以对相同的索引 04 进行操作,其中 a 值由它正确计算上一次迭代?如果第二个 for 循环访问 a[i+1] 会怎样?

最佳答案

你引用的 Material 是错误的。如果您将 schedule(static) 添加到两个循环,它就会变得正确 - 这保证了连续循环的线程之间索引的相同分布。默认计划是实现定义的,您不能假设它是static。引用标准:

Different loop regions with the same schedule and iteration count, even if they occur in the same parallel region, can distribute iterations among threads differently. The only exception is for the static schedule as specified in Table 2.5. Programs that depend on which thread executes a particular iteration under any other circumstances are non-conforming.

如果第二个 for 循环访问 a[i+1],您必须绝对将屏障留在那里。

关于c++ - 在两个连续的 pragma omp for 的情况下隐式屏障 vs nowait,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53277030/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com