基于任务的编程 : #pragma omp task versus #pragma omp parallel for-6ren

基于任务的编程 : #pragma omp task versus #pragma omp parallel for

转载作者：行者123 更新时间：2023-12-04 00:22:11

27

4

考虑:

    void saxpy_worksharing(float* x, float* y, float a, int N) {
      #pragma omp parallel for
      for (int i = 0; i < N; i++) {
         y[i] = y[i]+a*x[i];
      }
    }

和

    void saxpy_tasks(float* x, float* y, float a, int N) {
      #pragma omp parallel
      {
         for (int i = 0; i < N; i++) {
         #pragma omp task
         {
           y[i] = y[i]+a*x[i];
         }
      }
   }

使用任务和 omp 并行指令有什么区别？为什么我们可以用任务编写递归算法，例如归并排序，而不能用工作共享？

最佳答案

我建议您查看来自 Lawrence Livermore 国家实验室的 OpenMP 教程，可用 here .

您的特定示例应该是不是使用 OpenMP 任务实现。第二个代码创建 N乘以线程任务的数量(因为在缺少 } 旁边的代码中存在错误；我稍后会回来)，并且每个任务只执行一个非常简单的计算。正如您在我对 this question 的回答中所见，任务的开销将是巨大的。 .除了第二个代码在概念上是错误的。由于没有工作共享指令，所有线程将执行循环的所有迭代，而不是 N任务，N将创建的线程数的倍数。它应该以下列方式之一重写:

单任务生产者 - 常见模式，NUMA 不友好:

void saxpy_tasks(float* x, float* y, float a, int N) {
   #pragma omp parallel
   {
      #pragma omp single
      {
         for (int i = 0; i < N; i++)
            #pragma omp task
            {
               y[i] = y[i]+a*x[i];
            }
      }
   }
}

single指令将使循环仅在单个线程内运行。所有其他线程将跳过它并在 single 的末尾遇到隐式障碍。构造。由于屏障包含隐式任务调度点，等待线程将在任务可用时立即开始处理任务。

并行任务生产者 - 更 NUMA 友好:

void saxpy_tasks(float* x, float* y, float a, int N) {
   #pragma omp parallel
   {
      #pragma omp for
      for (int i = 0; i < N; i++)
         #pragma omp task
         {
            y[i] = y[i]+a*x[i];
         }
   }
}

在这种情况下，任务创建循环将在线程之间共享。

如果您不知道 NUMA 是什么，请忽略有关 NUMA 友好性的评论。

关于基于任务的编程 : #pragma omp task versus #pragma omp parallel for，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13065943/

27

4

0

文章推荐： r - 剪切和标签/断裂长度冲突

文章推荐： TextMate 卡住试图打开一个大文件

gcc - 我应该在Xcode中使用 "#pragma GCC ..."还是 "#pragma clang ..."
我应该使用其中哪些忽略警告？ #pragma clang diagnostic ignored "-W" #pragma GCC diagnostic ignored "-W" 两者似乎都对我有用，但
c++ - #pragma start 和#pragma exit 的用例
#pragma startup and #pragma exit: These directives helps us to specify the functions that are needed
objective-c - #pragma 标记的意义是什么？为什么我们需要#pragma 标记？
Xcode 中 #pragma 标记的目的是什么？它们在 .m 文件中的位置是否重要？某些 #pragma 是否应该排在所有其他之前？他们必须在场吗？可以添加新标记吗？他们为什么会这样？是什么原因
macros - nim - 自定义宏/pragma 以获取完整模块但获取 "cannot attach a custom pragma"
我想使用 nim 访问完整模块(文件)的 AST。我发现，任何宏都可以用作自定义编译指示，所以我在文件 foo.nim 中做了这样的事情: import macros macro getAst(ast
基于任务的编程 : #pragma omp task versus #pragma omp parallel for
考虑: void saxpy_worksharing(float* x, float* y, float a, int N) { #pragma omp parallel for
c++ - pragma omp parallel for 与 pragma omp parallel
在带有 openMP 的 C++ 中，两者之间有什么区别吗 #pragma omp parallel for for(int i=0; i
c++ - #pragma warning(push) 没有#pragma warning(pop)
在 Visual Studio 2010 中使用 C++ native 解决方案。 #pragma warning (push) 用于 cpp 文件的开头，在所有包含之后。之后，#pragma war
c++ - 当 pragma for 中有 pragma for 时，OpenMP 中会发生什么情况？
在 #pragma omp parallel 的开头创建了一堆线程，然后当我们到达 #pragma omp for 时，工作负载被分配。如果这个 for 循环内部有一个 for 循环，并且我在它之前也
c++ - 如果#pragma push_macro 没有#pragma pop_macro 会发生什么？
使用#pragma pop_macro("int") #include using namespace std; #define int double void main() { int i
c++ - pragma omp for inside pragma omp master or single
我正在处理一些事情，试图让孤立工作发挥作用，并通过减少 #pragma omp parallel 的调用来减少开销。我正在尝试的是这样的: #pragma omp parallel default(n
c++ - #pragma omp parallel 和 #pragma omp parallel for 之间的区别
我是 OpenMP 的新手，我一直在尝试运行一个使用 OpenMP 添加两个数组的程序。在 OpenMP 教程中，我了解到，在 for 循环上使用 OpenMP 时，我们需要使用 #pragma om
c - #pragma unroll(0) 和#pragma unroll(1) 有区别吗？
我阅读了有关循环展开的文档。它解释说，如果将展开因子设置为 1，则程序将像使用 #pragma nounrolling 一样工作。但是，该文件不包括#pragma unroll(0) 案例..由于
c++ - #pragma pack(16) 和#pragma pack(8) 的效果总是一样吗？
我正在尝试使用 #pragma pack (n) 对齐数据成员.以下面为例: #include using namespace std; #pragma pack(8) // or (16) str
c - 为什么 GCC 编译器不支持#pragma startup 和#pragma exit 指令？
我是 C 语言的菜鸟，正在尝试学习 #pragma 预处理器指令。我在谷歌上查找并找到了这个链接:GeeksforGeeks Pragma Directive in C 在这个链接中，他们说 #pra
c++ - OpenMP #pragma omp for v/s #pragma omp parallel for之间的区别？
之间有什么区别: #pragma omp for {for_loop} 和 #pragma omp parallel for {for_loop} 最佳答案 #pragma omp par
.net - 语句 "#pragma managed(push, off)"和 "#pragma managed(pop)"是什么意思？
我正在查看一些 C++/CLI 代码，并且看到了很多这样的语句，主要是围绕 #includes。他们的意思是什么？我知道他们，根据 MSDN，Enable function-level control
openmp - '#pragma omp master' 与 '#pragma omp single' 相比有什么好处？
在 OpenMP 中 #pragma omp master 中的任何代码指令由单个线程(主线程)执行，在区域末尾没有隐含的屏障。 (见 section on MASTER directive in t
cuda - 是否有 NVCC 的 `#pragma nv_exec_check_disable` 和/或 `#pragma hd_warning_disable` 的任何文档？
一些项目使用 #pragma nv_exec_check_disable 和/或 #pragma hd_warning_disable 使 NVCC 的警告静音 warning: calling a
openmp - Intel 的 pragma simd 与 OpenMP 的 pragma omp simd
英特尔编译器允许我们通过以下方式对循环进行矢量化 #pragma simd for ( ... ) 但是，您也可以选择使用 OpenMP 4 的指令执行此操作: #pragma omp simd fo
c - #pragma init 和 #pragma fini 在 linux 上使用 gcc 编译器
我想构建一些代码，在加载共享库时调用一些代码。我以为我会这样做: #pragma init(my_init) static void my_init () { //do-something }

首页

博学

6Ren·AI

商城

基于任务的编程 : #pragma omp task versus #pragma omp parallel for