c++ - 使用 OpenMP 并行运行的最简单示例-6ren

c++ - 使用 OpenMP 并行运行的最简单示例

转载作者：行者123 更新时间：2023-12-03 12:58:18

25

4

考虑以下代码构造，

int n = 0;

  #pragma omp parallel for collapse(2)
  for (int i = 0; i < 3; i++)
     for(int j = 0; j < 3; j++)
       n++;

现在上面是我试图在需要大量时间的代码中实现的类似事情的最简单的演示。因此，主要目标是并行化循环，从而减少运行时间。
我是 OpenMP 的新手，只知道一些命令，仅此而已。现在在我上面写的代码中，最终结果是错误的(n = 9 是正确答案)。我猜，循环试图同时访问相同的内存位置。
现在有人可以为此提供一个最简单的解决方案。请注意，我对此非常不了解。任何与此相关的阅读 Material 也将有所帮助。谢谢你。

最佳答案

I guess, the loops are trying to access the same memory locationsimultaneuouly.

TL,DR : 是的，您在更新变量 n 期间存在竞争条件。 .一种解决方法是使用 OpenMP 缩减条款。

I am new to OpenMP, just know some commands and that's all. Now in thecode I have written above, the final result comes wrong (n = 9 is theright answer).

更长的答案: #pragma omp parallel for将创建一个 parallel region ，然后到 threads将使用 default chunk size 分配该区域所包含的循环的迭代次数。，以及 default schedule这通常是 static .但是请记住， default schedule可能因 OpenMP 的不同具体实现而异标准。
来自 OpenMP 5.1您可以阅读更正式的描述:

The worksharing-loop construct specifies that the iterations of one ormore associated loops will be executed in parallel by threads in theteam in the context of their implicit tasks. The iterations aredistributed across threads that already exist in the team that isexecuting the parallel region to which the worksharing-loop regionbinds.

Moreover ,

The parallel loop construct is a shortcut for specifying a parallelconstruct containing a loop construct with one or more associatedloops and no other statements.

或非正式地， #pragma omp parallel for是构造函数 #pragma omp parallel的组合与 #pragma omp for .
因此，在您的代码中发生的情况是您有多个线程同时修改 n 的值。 , 要解决这个问题，您应该使用 OpenMP 缩减条款，从 OpenMP 标准可以阅读:

The reduction clause can be used to perform some forms of recurrencecalculations (...) in parallel. For parallel and work-sharingconstructs, a private copy of each list item is created, one for eachimplicit task, as if the private clause had been used. (...) Theprivate copy is then initialized as specified above. At the end of theregion for which the reduction clause was specified, the original listitem is updated by combining its original value with the final valueof each of the private copies, using the combiner of the specifiedreduction-identifier.

有关减少条款如何工作的更详细说明，请查看此 SO Thread .
因此，要解决代码中的竞争条件，只需将其更改为:

 int n = 0;

  #pragma omp parallel for collapse(2) reduction(+:n)
  for (int i = 0; i < 3; i++)
     for(int j = 0; j < 3; j++)
        n++;

关于c++ - 使用 OpenMP 并行运行的最简单示例，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65833061/

25

4

0

文章推荐： java - 如何通过传递新线程作为参数来执行执行器服务？

文章推荐： Java:多线程安全问题:使用线程扩展和锁

文章推荐： python - PyQt5 线程、信号和槽。连接错误

openmp - OpenMP 中的高斯消除
OpenMP 中的高斯消除。我是 openmp 的新手，想知道我是否在正确的地方使用了我的编译指示和屏障。我的 x 值每次都不同。他们应该是一样的吗？？ #include int num; doub
openmp - OpenMP 和矢量化之间的比较
给定一个示例函数(示例在下面给出)，for 循环可以使用 OpenMP 并行化或使用矢量化进行矢量化(假设编译器执行矢量化)。示例 void function(float* a, float* b,
openmp - OpenMP 中的原子性和关键性有什么区别？
OpenMP 中原子和关键之间有什么区别？我能做到 #pragma omp atomic g_qCount++; 但这和不一样吗 #pragma omp critical g_qCount++; ？
openmp - 给定依赖图生成 OpenMP 代码
我有一个关于如何在您考虑特定依赖关系图时生成 OpenMP 伪代码的问题。所以假设我们有这个特定的图表: 解决方案可能是这样的: #pragma omp parallel {
openmp - 使用 OpenMP 进行缩减
我正在尝试使用 openmp 计算二维矩阵的平均值。这个二维矩阵实际上是一个图像。我正在对数据进行线程分割。例如，如果我有 N线程比我处理行/N thread0 的行数，等等。我的问题是:我可以
openmp - 如何统计测量程序中的 OpenMP 性能？
我想统计测量与 OpenMP 并行化的程序的性能。我选择在执行并行算法的测试应用程序中编写循环 MAX_EXPERIMENTS次并将时间测量报告到文件中。问题解决方案似乎比提取外部循环上方的并行编译
openmp - OpenMP 中的循环顺序折叠性能建议
我找到了 Intel's performance suggestion on Xeon Phi关于 OpenMP 中的 Collapse 子句。 #pragma omp parallel for co
openmp - 如何使用 OpenMP 并行化数组移位？
如何使用 OpenMP 并行化数组移位？我尝试了一些方法，但在以下示例中没有得到任何准确的结果(该示例旋转 Carteira 对象数组的元素，用于排列算法): void rotaciona(int
openmp - 使用 openmp 并行执行函数
我有一系列对几个独立函数的调用。 func1(arg); func2(arg); func3(arg); 我想并行执行它们，而不是串行执行它们。我目前正在使用 #pragma omp parallel
openmp - openmp 中的 Dependent 子句不尊重声明的依赖
我正在尝试使用 openmp 任务来安排基本 jacobi2d 计算的平铺执行。在 jacobi2d 中，依赖于 A(i,j) 从 A(i, j) A(i-1, j) A(i+1, j) A(i, j
openmp - 在 OpenMP 中，如何让每个内核运行一个线程？
我在 3 天前开始使用 OpenMP。我想知道如何使用#pragma使每个内核运行一个线程。详细信息:- int ncores = omp_get_num_procs();for(i = 0; i <
openmp - OpenMP 中的 Schedule 子句
我有一段代码(它是应用程序的一部分)，我正在尝试使用 OpenMP 对其进行优化，正在尝试各种调度策略。就我而言，我注意到 schedule(RUNTIME)条款比其他条款有优势(我没有指定 chun
openmp - OpenMP 或 MPI 哪个更容易学习和调试？
我有一个数字运算 C/C++ 应用程序。它基本上是不同数据集的主循环。我们可以使用 openmp 和 mpi 访问一个 100 节点的集群。我想加速应用程序，但我是 mpi 和 openmp 的绝对新
openmp - OpenMP 分发中的 SECTIONS 指令如何工作？
在 OpenMP 中使用ompsections时，线程会被分配到sections内的 block ，还是每个线程会被分配到每个section？当nthreads == 3时: #pragma omp
openmp - cython openmp 单，屏障
我正在尝试在 cython 中使用 openmp。我需要在 cython 中做两件事: i) 在我的 cython 代码中使用 #pragma omp single{} 作用域。 ii) 使用#pra
openmp - 为什么 OpenMP 不能在 for 循环内有部分？
我正在尝试通过将循环的每次迭代作为 OpenMP 部分来并行化 OpenMP 中基于范围的 for 循环。我想这样做: #pragma omp parallel sections { for ( au
openmp - cython openmp 单，屏障
我正在尝试在 cython 中使用 openmp。我需要在 cython 中做两件事: i) 在我的 cython 代码中使用 #pragma omp single{} 作用域。 ii) 使用#pra
openmp - 将并行程序转换为集群程序。从 OpenMP 到？
我想编写一个代码转换器，它采用基于 OpenMP 的并行程序并在集群上运行它。我该如何解决这个问题？我使用哪些库？如何为此设置小型集群？我发现很难在 Internet 上找到有关集群计算的好 Ma
c++ - OpenMP - OpenMP 'for' 语句中的索引变量必须具有带符号的整数类型
我是 OpenMP 的新手。我正在尝试为 for 循环使用多个内核，但出现此编译错误: “错误 C3016:'x':OpenMP 'for' 语句中的索引变量必须具有带符号的整数类型”。我知道 Op
openmp - 使用 Qt creator 时如何开启 OpenMP
如果我使用 VS 2010 编译器从 Qt Creator 构建项目，我如何启用 OpenMP(从 Visual Studio 构建时，您只需启用该功能)谢谢最佳答案在 .pro 文件中尝试下一步

首页

博学

6Ren·AI

商城

c++ - 使用 OpenMP 并行运行的最简单示例