- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是 OpenMP
的新手,我一直在尝试运行一个使用 OpenMP 添加两个数组的程序。在 OpenMP 教程中,我了解到,在 for 循环上使用 OpenMP 时,我们需要使用 #pragma omp parallel for。但我也用 #pragma omp parallel 尝试过同样的事情,它也给了我正确的输出。下面是我想要传达的内容的代码片段。
#pragma omp parallel for
{
for(int i=0;i<n;i++)
{
c[i]=a[i]+b[i];
}
}
和
#pragma omp parallel
{
for(int i=0;i<n;i++)
{
c[i]=a[i]+b[i];
}
}
这两者有什么区别?
最佳答案
#pragma omp parallel
:
将创建一个parallel region
团队成员 threads
,其中每个线程将执行 parallel region
的整个代码块。附上。
来自OpenMP 5.1人们可以阅读更正式的描述:
When a thread encounters a parallel construct, a team of threads iscreated to execute the parallel region (..). Thethread that encountered the parallel construct becomes the primarythread of the new team, with a thread number of zero for the durationof the new parallel region. All threads in the new team, including theprimary thread, execute the region. Once the team is created, thenumber of threads in the team remains constant for the duration ofthat parallel region.
:
#pragma omp parallel for
将创建一个parallel region
(如前所述),以及threads
对于该区域,将使用 default chunk size
分配它所包含的循环的迭代。 ,以及default schedule
通常 static
。但请记住,default schedule
OpenMP
的不同具体实现可能会有所不同标准。
来自OpenMP 5.1您可以阅读更正式的描述:
The worksharing-loop construct specifies that the iterations of one ormore associated loops will be executed in parallel by threads in theteam in the context of their implicit tasks. The iterations aredistributed across threads that already exist in the team that isexecuting the parallel region to which the worksharing-loop regionbinds.
Moreover ,
The parallel loop construct is a shortcut for specifying a parallelconstruct containing a loop construct with one or more associatedloops and no other statements.
或者非正式地,#pragma omp parallel for
是构造函数 #pragma omp parallel
的组合与 #pragma omp for
。就您而言,这意味着:
#pragma omp parallel for
{
for(int i=0;i<n;i++)
{
c[i]=a[i]+b[i];
}
}
在语义和逻辑上都与:
#pragma omp parallel
{
#pragma omp for
for(int i=0;i<n;i++)
{
c[i]=a[i]+b[i];
}
}
TL;DR: 在您的示例中,使用 #pragma omp parallel for
循环将在线程之间并行化(即,循环迭代将在线程之间划分),而 #pragma omp parallel
所有线程将(并行)执行所有循环迭代。
为了使其更具说明性,使用 4
线程#pragma omp parallel
,会产生如下结果:
而#pragma omp parallel for
与 chunk_size=1
和静态 schedule
会导致类似的结果:
从代码角度来看,循环将转换为逻辑上类似于:
for(int i=omp_get_thread_num(); i < n; i+=omp_get_num_threads())
{
c[i]=a[i]+b[i];
}
The omp_get_thread_num routine returns the thread number, within thecurrent team, of the calling thread.
Returns the number of threads in the current team. In a sequentialsection of the program omp_get_num_threads returns 1.
或者换句话说,for(int i = THREAD_ID; i < n; i += TOTAL_THREADS)
。与THREAD_ID
范围从 0
至TOTAL_THREADS - 1
,和TOTAL_THREADS
表示在并行区域上创建的团队线程总数。
I have learned that we need to use #pragma omp parallel for whileusing OpenMP on the for loop. But I have also tried the same thingwith #pragma omp parallel and it is also giving me the correct output.
它会为您提供相同的输出,因为在您的代码中:
c[i]=a[i]+b[i];
数组a
和数组b
只能读取,数组 c[i]
是唯一被更新的,其值不取决于迭代次数 i
将被执行。尽管如此,与 #pragma omp parallel for
每个线程都会更新自己的i
,而 #pragma omp parallel
线程将更新相同的 i
s,因此覆盖彼此的值(value)观。
现在尝试使用以下代码执行相同的操作:
#pragma omp parallel for
{
for(int i=0;i<n;i++)
{
c[i]= c[i] + a[i] + b[i];
}
}
和
#pragma omp for
{
for(int i=0;i<n;i++)
{
c[i] = c[i] + a[i] + b[i];
}
}
您会立即注意到差异。
关于c++ - #pragma omp parallel 和 #pragma omp parallel for 之间的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65247801/
平时很少在jquery中用到this。查看代码时发现用到了,就调试出this的值,心想原来如此。还是挺有用的。这里总结一下this与$(this)的区别和使用。 $(this)生成的是什么?
使用单例类和应用程序范围的托管 bean 来保存应用程序数据有区别吗? 我需要查找某些 JNDI 资源,例如远程 bean 接口(interface),因此我为自己编写了一个单例来缓存我的引用并且只允
如果您仔细查看包含的图片,您会注意到您可以使用 Eclipse IDE 重构 Groovy 代码并将方法转换为闭包,反之亦然。那么,闭包到底是什么,它与方法有什么不同呢?有人可以举一个使用闭包的好例子
vagrant box repackage有什么区别( docs ) 和 vagrant package ( docs )? 我意识到 vagrant package仅适用于 VirtualBox 提
我想看看是否有人可以解释为什么以下代码适用于 valueOf 但不适用于其他代码。 import java.math.BigDecimal; public class Change { publ
这个问题已经有答案了: 已关闭12 年前。 Possible Duplicates: What is Closures/Lambda in PHP or Javascript in layman te
This question already has answers here: Vagrant, Docker, Puppet, Chef (3个答案) 2年前关闭。 docker和chef有什么共同
以下代码在95%的机器上产生相同的输出,但是在几台机器上却有所不同。在 Debug模式下,输出: Changing from New to Fin OK 但在 Release模式下: Changing
////Creating Object var Obj; // init Object Obj= {}; 它们之间有什么区别两个? 有没有可能把它变成一个单行? 这样使用有什么好处吗?
我想找出定时器服务之间的区别。我应该使用哪个以及何时使用。我正在使用 Jboss 应用服务器。 1) java.ejb.Schedule。 @Schedule注解或配置自xml。 2) javax.e
我发现在 C++ 中可以通过三种不同的方式将对象传递给函数。假设我的类(class)是这样的: class Test { int i; public: Test(int x);
有什么区别。 public class Test { public static void main(String args[]) { String toBeCast = "c
如果我有一列,设置为主索引,设置为INT。 如果我不将其设置为自动递增,而只是将唯一的随机整数插入其中,与自动递增相比,这是否会减慢 future 的查询速度? 如果我在主索引和唯一索引为 INT 的
这两种日期格式有什么区别。第一个给出实际时间,第二个给出时间购买添加时区偏移值。 NSDateFormatter * dateFormatter = [[NSDateFormatter alloc]
如果有一个函数,请说foo: function foo() { console.log('bar'); } 那么在 JavaScript 中,从另一个函数调用一个函数有什么区别,如下所示: f
关闭。这个问题是opinion-based 。目前不接受答案。 想要改进这个问题吗?更新问题,以便 editing this post 可以用事实和引文来回答它。 . 已关闭 4 年前。 Improv
代码是什么: class Time { private: int hours; int minutes; int seconds; pu
我知道这是非常基本的,但有人介意解释一下这两个数组声明之间的区别吗: #include array myints; ...和: int myints[5]; ...以及为什么 myints.size
我学会了如何根据 http://reference.sitepoint.com/css/specificity 计算 css 特异性但是,基于this reference,我不明白伪类(来自c)和伪元
为什么在运行 2) 时会出现额外的空行?对我来说 1 就像 2。那么为什么 2) 中的额外行? 1) export p1=$(cd $(dirname $0) && pwd) #
我是一名优秀的程序员,十分优秀!