gpt4 book ai didi

c - openmp:屏障同步在带有 if 条件的循环内不起作用

转载 作者:行者123 更新时间:2023-11-30 15:44:48 25 4
gpt4 key购买 nike

我有以下代码:

#pragma omp parallel shared(a,n) private(i,j,k,x,pid,rows,mymin,mymax)
{
// nprocs=1;
#ifdef _OPENMP
nprocs=omp_get_num_threads();
#endif

#ifdef _OPENMP
pid=omp_get_thread_num();
#endif

rows=n/nprocs;
mymin=pid * rows;
mymax=mymin + rows - 1;

for(k=0;k<n;k++){
if(k>=mymin && k<=mymax){
#pragma omp for schedule(static,rows)
for(x=k+1;x<n;x++){
a[k][x]= a[k][x]/a[k][k];
}
#pragma omp barrier
}
}
}

这里我选择哪个线程将根据 if 条件更新矩阵的哪一行。例如,如果有两个线程,线程 1 将更新矩阵 'a' 的前两行,线程 2 将更新另外两行。

选择该选项后,我通过并行线程 1 和线程 2 之间的内部循环(从 for(x=k+1,x<n;x++) 开始)来划分该行的列上的迭代。我还在内部 for 循环之后放置了一个屏障,以便在更新单行的每个列值后,它会同步。

但问题是我没有获得正确的同步值。在最终矩阵中,某些行中显示了线程 0 更新的一些值,其他线程更新了一些值,但不是全部。

最佳答案

此处使用 omp Barrier 是没有用的,因为除非指定 nowait 子句,否则 omp for 构造的末尾有一个隐式屏障.

另一方面,您不需要手动指定如何将工作分解为线程,而且您的分解方式并不正确。

您实际上想要做的事情可以写成如下。

#pragma omp parallel for shared(a,n) private(k,x)
for(k=0;k<n;k++){
for(x=k+1;x<n;x++){
a[k][x]= a[k][x]/a[k][k];
}
}

由于不同 k 之间的工作负载不平衡,您可能还需要使用 schedule(dynamic, ...) 子句。请参阅 omp 文档以获取更多信息。

http://msdn.microsoft.com/en-us/library/b5b5b6eb.aspx

关于c - openmp:屏障同步在带有 if 条件的循环内不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19330137/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com