gpt4 book ai didi

c++ - 在与 OpenMP 并行化的嵌套 for 循环中写入共享数组(通过指针)如何产生错误结果?

转载 作者:太空宇宙 更新时间:2023-11-04 14:15:04 25 4
gpt4 key购买 nike

我有一个非常奇怪的问题,我正在尝试解决和理解。我有一个以下形式的嵌套 for 循环:

#pragma omp parallel for schedule(guided) shared(Array) collapse(3)
for (int i=istart; i<iend; i++)
{
for (int j=jstart; j<jend; j++)
{
for(int k=kstart; k<kend; k++)
{
Int IJK = (i*(jend-jstart) + (j-jstart))*(kend-kstart) + (k-kstart);
Array[3*IJK + 2] = an operation with some shared values;
}
}
}

这种形式有3个循环,分别是Array[3*IJK]Array[3*IJK + 1]Array[3*IJK +2] 分别。 Array 实际上也是一个共享指针,对于 IJK 的值,实际上调用了一个函数(内联)。

我首先尝试并行化所有循环并且程序运行通过,但结果与我的串行结果不同。

现在是奇怪的部分。

具有相同结构但具有 Array[3*IJK + 1] 的 for 循环在并行化时会产生正确的结果(在这种情况下其他循环是串行的)。但是,一旦我将其他循环之一并行化,我就会得到不同的结果。只有这个循环在其自身并行化时才能产生正确的结果。

此外,如果我不使用 collapsecollapse(2) 而不是 collapse(3),我会得到不同的结果.只有使用上面的 #pragma 语句,我才能在 Array[3*IJK + 1] 循环中得到正确的结果。

我认为这可能与写入 Array 的顺序有关,但是使用有序的子句和构造,我仍然得到错误的结果。

这可能是什么原因?

最佳答案

你确定你的连环案例是正确的吗?

你的IJK 计算对我来说毫无意义;一方面,它根本不依赖于 j。实际上,如果两个线程获得相同的 (i,k) 对,但 j 不同——使用 collapse(3) 肯定是可能的——将出现竞争条件,因为它们都将尝试写入同一个 IJK。

你确定你不想要这样的东西吗

   Int IJK = (i*(jend-jstart) + (j-jstart))*(kend-kstart) + (k-kstart);

?

关于c++ - 在与 OpenMP 并行化的嵌套 for 循环中写入共享数组(通过指针)如何产生错误结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11976161/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com