c - 使用 #pragma parashare 在 OpenMP 中并行化嵌套循环-6ren

c - 使用 #pragma parashare 在 OpenMP 中并行化嵌套循环

转载作者：行者123 更新时间：2023-11-30 17:46:41

26

4

我正在尝试并行化代码。我的代码如下所示 -

    #pragma omp parallel private(i,j,k)
    #pragma omp parallel for shared(A)
    for(k=0;k<100;<k++)
     for(i=1;i<1024;<i++)
      for(j=0;j<1024;<j++)
       A[i][j+1]=<< some expression involving elements of A[i-1][j-1] >>

执行此代码时，我从循环的串行执行中得到了不同的结果。我无法理解我做错了什么。

我也尝试过崩溃()

    #pragma omp parallel private(i,j,k)
    #pragma omp parallel for collapse(3) shared(A)
    for(k=0;k<100;<k++)
     for(i=1;i<1024;<i++)
      for(j=0;j<1024;<j++)
       A[i][j+1]=<< some expression involving elements of A[][] >>

我尝试的另一件事是在每个循环之前使用#pragma omp parallel for而不是collapse()。

我认为问题在于数据依赖性。知道如何在数据依赖的情况下并行化吗？

最佳答案

如果这确实是您的用例，只需对外部循环进行并行化，k，这应该足以满足您在常见架构上拥有的适度并行性。

如果您想要更多，则必须重新编写循环，以便拥有不具有依赖性的内部部分。在您的示例中，这相对容易，您必须通过“对角线”(外循环，顺序)进行处理，然后在对角线内部您将是独立的。

for (size_t d=0; d<nDiag(100); ++d) {
   size_t nPoints = somefunction(d);
#pragma omp parallel
   for (size_t p=0; p<nPoints; ++p) {
      size_t x = coX(p, d);
      size_t y = coY(p, d);
      ... your real code ...
   }

}

其中一部分可以自动完成，但我认为此类工具尚未在日常 OMP 中轻松实现。这是一个活跃的研究领域。

另请注意以下事项

int 对于索引来说并不是一个好主意，特别是在访问矩阵时。如果您必须自己计算条目的绝对位置(并且您看到您可能在这里)，那么很容易溢出。 int 通常是 32 位宽，在这 32 位中，您甚至浪费了一位作为符号。在 C 中，对象大小通过 size_t 计算，大多数情况下为 64 位宽，并且在任何情况下都是平台设计者选择的正确类型。
将局部变量用于循环索引和其他临时变量，正如您所见，编写 OMP 编译指示变得更加容易。局部性是并行性的关键之一。正确地表达这一点对你自己和编译器都有帮助。

关于c - 使用 #pragma parashare 在 OpenMP 中并行化嵌套循环，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19193725/

26

4

0

文章推荐： Unix 中的 C 解析错误

文章推荐： C : convert to integer using bits

文章推荐：命令截断输出的第一行

文章推荐： c - 我必须按两次CTRL+D才能结束输入，为什么？如何更正？

gcc - 我应该在Xcode中使用 "#pragma GCC ..."还是 "#pragma clang ..."
我应该使用其中哪些忽略警告？ #pragma clang diagnostic ignored "-W" #pragma GCC diagnostic ignored "-W" 两者似乎都对我有用，但
c++ - #pragma start 和#pragma exit 的用例
#pragma startup and #pragma exit: These directives helps us to specify the functions that are needed
objective-c - #pragma 标记的意义是什么？为什么我们需要#pragma 标记？
Xcode 中 #pragma 标记的目的是什么？它们在 .m 文件中的位置是否重要？某些 #pragma 是否应该排在所有其他之前？他们必须在场吗？可以添加新标记吗？他们为什么会这样？是什么原因
macros - nim - 自定义宏/pragma 以获取完整模块但获取 "cannot attach a custom pragma"
我想使用 nim 访问完整模块(文件)的 AST。我发现，任何宏都可以用作自定义编译指示，所以我在文件 foo.nim 中做了这样的事情: import macros macro getAst(ast
基于任务的编程 : #pragma omp task versus #pragma omp parallel for
考虑: void saxpy_worksharing(float* x, float* y, float a, int N) { #pragma omp parallel for
c++ - pragma omp parallel for 与 pragma omp parallel
在带有 openMP 的 C++ 中，两者之间有什么区别吗 #pragma omp parallel for for(int i=0; i
c++ - #pragma warning(push) 没有#pragma warning(pop)
在 Visual Studio 2010 中使用 C++ native 解决方案。 #pragma warning (push) 用于 cpp 文件的开头，在所有包含之后。之后，#pragma war
c++ - 当 pragma for 中有 pragma for 时，OpenMP 中会发生什么情况？
在 #pragma omp parallel 的开头创建了一堆线程，然后当我们到达 #pragma omp for 时，工作负载被分配。如果这个 for 循环内部有一个 for 循环，并且我在它之前也
c++ - 如果#pragma push_macro 没有#pragma pop_macro 会发生什么？
使用#pragma pop_macro("int") #include using namespace std; #define int double void main() { int i
c++ - pragma omp for inside pragma omp master or single
我正在处理一些事情，试图让孤立工作发挥作用，并通过减少 #pragma omp parallel 的调用来减少开销。我正在尝试的是这样的: #pragma omp parallel default(n
c++ - #pragma omp parallel 和 #pragma omp parallel for 之间的区别
我是 OpenMP 的新手，我一直在尝试运行一个使用 OpenMP 添加两个数组的程序。在 OpenMP 教程中，我了解到，在 for 循环上使用 OpenMP 时，我们需要使用 #pragma om
c - #pragma unroll(0) 和#pragma unroll(1) 有区别吗？
我阅读了有关循环展开的文档。它解释说，如果将展开因子设置为 1，则程序将像使用 #pragma nounrolling 一样工作。但是，该文件不包括#pragma unroll(0) 案例..由于
c++ - #pragma pack(16) 和#pragma pack(8) 的效果总是一样吗？
我正在尝试使用 #pragma pack (n) 对齐数据成员.以下面为例: #include using namespace std; #pragma pack(8) // or (16) str
c - 为什么 GCC 编译器不支持#pragma startup 和#pragma exit 指令？
我是 C 语言的菜鸟，正在尝试学习 #pragma 预处理器指令。我在谷歌上查找并找到了这个链接:GeeksforGeeks Pragma Directive in C 在这个链接中，他们说 #pra
c++ - OpenMP #pragma omp for v/s #pragma omp parallel for之间的区别？
之间有什么区别: #pragma omp for {for_loop} 和 #pragma omp parallel for {for_loop} 最佳答案 #pragma omp par
.net - 语句 "#pragma managed(push, off)"和 "#pragma managed(pop)"是什么意思？
我正在查看一些 C++/CLI 代码，并且看到了很多这样的语句，主要是围绕 #includes。他们的意思是什么？我知道他们，根据 MSDN，Enable function-level control
openmp - '#pragma omp master' 与 '#pragma omp single' 相比有什么好处？
在 OpenMP 中 #pragma omp master 中的任何代码指令由单个线程(主线程)执行，在区域末尾没有隐含的屏障。 (见 section on MASTER directive in t
cuda - 是否有 NVCC 的 `#pragma nv_exec_check_disable` 和/或 `#pragma hd_warning_disable` 的任何文档？
一些项目使用 #pragma nv_exec_check_disable 和/或 #pragma hd_warning_disable 使 NVCC 的警告静音 warning: calling a
openmp - Intel 的 pragma simd 与 OpenMP 的 pragma omp simd
英特尔编译器允许我们通过以下方式对循环进行矢量化 #pragma simd for ( ... ) 但是，您也可以选择使用 OpenMP 4 的指令执行此操作: #pragma omp simd fo
c - #pragma init 和 #pragma fini 在 linux 上使用 gcc 编译器
我想构建一些代码，在加载共享库时调用一些代码。我以为我会这样做: #pragma init(my_init) static void my_init () { //do-something }

首页

博学

6Ren·AI

商城

c - 使用 #pragma parashare 在 OpenMP 中并行化嵌套循环