- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我似乎不完全理解带有嵌套 for 循环的 openmp 并行构造的行为。考虑以下代码:
std::size_t idx;
std::size_t idx2;
omp_set_num_threads( 2 );
#pragma omp parallel default(shared) private(idx, idx2)
{
for(std::size_t idx=0;idx<3;idx++)
{
for(std::size_t idx2=0;idx2<4;idx2++)
{
LOG("From thread "+std::to_string(omp_get_thread_num())+" idx "+std::to_string(idx)+" idx2 "+std::to_string(idx2));
}
}
}
这会产生以下输出:
From thread 0 idx 0 idx2 0
From thread 1 idx 0 idx2 0
From thread 0 idx 0 idx2 1
From thread 1 idx 0 idx2 1
From thread 0 idx 0 idx2 2
From thread 1 idx 0 idx2 2
From thread 0 idx 0 idx2 3
From thread 1 idx 0 idx2 3
From thread 0 idx 1 idx2 0
From thread 1 idx 1 idx2 0
From thread 0 idx 1 idx2 1
From thread 1 idx 1 idx2 1
From thread 0 idx 1 idx2 2
From thread 1 idx 1 idx2 2
From thread 0 idx 1 idx2 3
From thread 1 idx 1 idx2 3
From thread 0 idx 2 idx2 0
From thread 1 idx 2 idx2 0
From thread 0 idx 2 idx2 1
From thread 1 idx 2 idx2 1
From thread 0 idx 2 idx2 2
From thread 1 idx 2 idx2 2
From thread 0 idx 2 idx2 3
From thread 1 idx 2 idx2 3
上面似乎发生的事情是分配了 2 个线程来执行两个嵌套循环,结果它们产生了上面的输出(总共 2*3*4=24 条日志消息),这很简单。
但现在考虑以下代码,其中内部 for 循环被声明为 pragma omp for
std::size_t idx;
std::size_t idx2;
omp_set_num_threads( 2 );
#pragma omp parallel default(shared) private(idx, idx2)
{
for(std::size_t idx=0;idx<3;idx++)
{
#pragma omp for
for(std::size_t idx2=0;idx2<4;idx2++)
{
LOG("From thread "+std::to_string(omp_get_thread_num())+" idx "+std::to_string(idx)+" idx2 "+std::to_string(idx2));
}
}
}
这会产生以下 3*4=12 条日志消息:
From thread 0 idx 0 idx2 0
From thread 1 idx 0 idx2 2
From thread 0 idx 0 idx2 1
From thread 1 idx 0 idx2 3
From thread 0 idx 1 idx2 0
From thread 1 idx 1 idx2 2
From thread 0 idx 1 idx2 1
From thread 1 idx 1 idx2 3
From thread 0 idx 2 idx2 0
From thread 0 idx 2 idx2 1
From thread 1 idx 2 idx2 2
From thread 1 idx 2 idx2 3
我本来希望再次将两个线程分配给对应于两个内部 for 循环的代码,并再次获得 24 条输出消息。为什么这两种情况下的输出不同?
最佳答案
第一种情况#pragma omp parallel
在每个线程上运行一次整个并行区域。这意味着两个线程将完全运行两个 for 循环,因此每个线程应生成 4*3=12 行输出。
在第二种情况下,内部 #pragma omp for
告诉计算机 idx2
上的内部 for 循环应该在可用线程之间拆分。因此,不是两个线程都执行从 0 到 idx2
的内部循环,而是内部循环的每次迭代都只执行一次。
在第二个输出中,我们应该看到 idx2
的所有值都为 idx
的每个值打印一次,并且来自恰好可用的任何线程。
例如如果 idx
只能为零,则输出可能类似于:
From thread ? idx 0 idx2 0
From thread ? idx 0 idx2 1
From thread ? idx 0 idx2 2
From thread ? idx 0 idx2 3
?
表示它可以是任何可用的线程。
关于c++ - pragma omp 与 for 循环并行的行为,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54016089/
我应该使用其中哪些忽略警告? #pragma clang diagnostic ignored "-W" #pragma GCC diagnostic ignored "-W" 两者似乎都对我有用,但
#pragma startup and #pragma exit: These directives helps us to specify the functions that are needed
Xcode 中 #pragma 标记的目的是什么?它们在 .m 文件中的位置是否重要?某些 #pragma 是否应该排在所有其他之前? 他们必须在场吗? 可以添加新标记吗?他们为什么会这样?是什么原因
我想使用 nim 访问完整模块(文件)的 AST。我发现,任何宏都可以用作自定义编译指示,所以我在文件 foo.nim 中做了这样的事情: import macros macro getAst(ast
考虑: void saxpy_worksharing(float* x, float* y, float a, int N) { #pragma omp parallel for
在带有 openMP 的 C++ 中,两者之间有什么区别吗 #pragma omp parallel for for(int i=0; i
在 Visual Studio 2010 中使用 C++ native 解决方案。 #pragma warning (push) 用于 cpp 文件的开头,在所有包含之后。之后,#pragma war
在 #pragma omp parallel 的开头创建了一堆线程,然后当我们到达 #pragma omp for 时,工作负载被分配。如果这个 for 循环内部有一个 for 循环,并且我在它之前也
使用#pragma pop_macro("int") #include using namespace std; #define int double void main() { int i
我正在处理一些事情,试图让孤立工作发挥作用,并通过减少 #pragma omp parallel 的调用来减少开销。我正在尝试的是这样的: #pragma omp parallel default(n
我是 OpenMP 的新手,我一直在尝试运行一个使用 OpenMP 添加两个数组的程序。在 OpenMP 教程中,我了解到,在 for 循环上使用 OpenMP 时,我们需要使用 #pragma om
我阅读了有关循环展开的文档。它解释说,如果将展开因子设置为 1,则程序将像使用 #pragma nounrolling 一样工作。 但是,该文件不包括#pragma unroll(0) 案例..由于
我正在尝试使用 #pragma pack (n) 对齐数据成员.以下面为例: #include using namespace std; #pragma pack(8) // or (16) str
我是 C 语言的菜鸟,正在尝试学习 #pragma 预处理器指令。我在谷歌上查找并找到了这个链接:GeeksforGeeks Pragma Directive in C 在这个链接中,他们说 #pra
之间有什么区别: #pragma omp for {for_loop} 和 #pragma omp parallel for {for_loop} 最佳答案 #pragma omp par
我正在查看一些 C++/CLI 代码,并且看到了很多这样的语句,主要是围绕 #includes。他们的意思是什么?我知道他们,根据 MSDN,Enable function-level control
在 OpenMP 中 #pragma omp master 中的任何代码指令由单个线程(主线程)执行,在区域末尾没有隐含的屏障。 (见 section on MASTER directive in t
一些项目使用 #pragma nv_exec_check_disable 和/或 #pragma hd_warning_disable 使 NVCC 的警告静音 warning: calling a
英特尔编译器允许我们通过以下方式对循环进行矢量化 #pragma simd for ( ... ) 但是,您也可以选择使用 OpenMP 4 的指令执行此操作: #pragma omp simd fo
我想构建一些代码,在加载共享库时调用一些代码。我以为我会这样做: #pragma init(my_init) static void my_init () { //do-something }
我是一名优秀的程序员,十分优秀!