gpt4 book ai didi

c++ - openMP - 并发访问变量和原子

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:04:46 25 4
gpt4 key购买 nike

我想用 openMP 并行化一个对框进行采样的函数(在框中随机选择点,并在这些点上评估给定函数)。我写了下面的代码。

//storing points
double** points_ = new double*[N-m];
for(int i=0;i<N-m;i++)
{
points_[i]=new double[ndim];
}
double* evals_ = new double[N-m];

#pragma omp parallel for
for(int i=0;i<N-m;i++)
{
double* pt_ = randomPoint(lower,upper);
for(int k=0;k<ndim;k++)
{
points_[i][k]=pt_[k];
}
evals_[i]=evalFunc(pt_);
delete pt_;
}

但是,我对这段代码没有信心:evals_ 和 points_ 在 each 线程中更新。我想在那里添加一些原子语句:

#pragma omp parallel for 
for(int i=0;i<N-m;i++)
{
double* pt_ = randomPoint(m_lower,m_upper);
for(int k=0;k<m_ndim;k++)
{
#pragma omp atomic update
points_[i][k]=pt_[k];
}
#pragma omp atomic update
evals_[i]=evalFunc(pt_);
delete pt_;
}

但我担心这会非常低效:你有什么建议可以更准确地写出来吗?并且...这不是编译...(错误:#pragma omp atomic 之后的表达式形式不正确)尽管我可以在 openMP 规范 A22 中找到该示例

void atomic_example(float *x, float *y, int *index, int n)
{
int i;
#pragma omp parallel for shared(x, y, index, n)
for (i=0; i<n; i++) {
#pragma omp atomic update
x[index[i]] += work1(i);
y[i] += work2(i);
}
}

并且原子更新之后还跟随着对数组的影响。

感谢和问候。

编辑--------

我同意都铎的回答。然而,这里的这个例子似乎在另一段并行化的代码中确实需要原子:在 sum_+=... 行,发生错误(并发访问)

for(i=0;i<m_ndim;i++)
{
double sum_=0;
#pragma omp parallel reduction(+:sum_)
for(j=0;j<m_npts;j++)
{
sum_ += set_[j][i];
}
Sum_[i] = sum_;
}

为什么需要它?还是有其他问题?

最佳答案

您的代码中不需要任何原子子句。

原因是外层循环在索引 i 上拆分,因此每个线程将从 points_eval_ 不与另一个线程的工作集重叠。

evals_ 是一个数组,所以每个线程都会得到一个连续的子数组(由于隐式静态调度方案),例如

0 1 2 3 . 4 5 6 7 . 8 9 10 11...
t1 t2 t3

points_ 是一个二维矩阵,每个线程都会得到一组连续的行:

   0 
1
t1 2
3
.
4
5
t2 6
7
.
8
9
t3 10
11
...

在第二种情况下,您似乎在 k 的值上有重叠,因为每个线程都有相同的 k 范围,但更新的点下降在不同的行上(索引 i),如上所示,不同的线程不会重叠。

关于c++ - openMP - 并发访问变量和原子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10170118/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com