c++ - openMP过度同步-6ren

c++ - openMP过度同步

转载作者：太空宇宙更新时间：2023-11-04 12:57:49

24

4

我正在尝试将 openMP 并行化添加到一个相当大的项目中，我发现 openMP 在并行 block 之外做了太多同步。

这种同步是针对所有变量完成的，甚至是那些没有在并行 block 中使用的变量，而且它是连续完成的，而不仅仅是在进入 block 之前。

我举了一个例子来证明这一点:

#include <cmath>

int main()
{
    double dummy1 = 1.234;

    int const size = 1000000;
    int const size1 = 2500;
    int const size2 = 500;

    for(unsigned int i=0; i<size; ++i){

        //for (unsigned int j=0; j<size1; j++){
        //  dummy1 = pow(dummy1/2 + 1, 1.5);
        //}

        #pragma omp parallel for
        for (unsigned int j=0; j<size2; j++){
            double dummy2 = 2.345;
            dummy2 = pow(dummy2/2 + 1, 1.5);
        }
    }
}

如果我运行此代码(注释了 for 循环)，运行时间为 6.75 秒(带并行化)和 30.6 秒(不带并行化)。太好了。

但是如果我取消注释 for 循环并再次运行它，过度同步就会开始，我得到的结果是 67.9 秒的并行化和 73 秒的并行化。如果我增加 size1，与没有并行化相比，我什至会得到更慢的结果。

有没有办法禁用此同步并仅在第二个 for 循环之前强制它？或任何其他方式如何提高速度？

请注意，在实际示例中，外部的第一个 for 循环都不是可并行化的。外层实际上是一个 ODE 求解器，而第一个内层是更新内部值负载。

我使用的是 gcc (SUSE Linux) 4.8.5

感谢您的回答。

最佳答案

最后，我的问题的解决方案是指定线程数 = 处理器核心数。似乎是超线程导致了问题。所以使用(我的处理器有 4 个真正的内核)

#pragma omp parallel for num_threads(4)

没有第一个 for 循环我得到 8.7 秒的时间，有它的时间为 51.9 秒。仍然有大约 1.2s 的开销，但这是可以接受的。使用默认值(8 个线程)

#pragma omp parallel for

时间分别是6.65s和68s。这里的开销大约是 19s。

因此，如果没有其他代码存在，超线程会有所帮助，但如果存在，使用它可能并不总是一个好主意。

关于c++ - openMP过度同步，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45755807/

24

4

0

文章推荐： php - PHP中的进程间通信

文章推荐： ruby - 在 Ubuntu 14.04 上安装 Koala(Sass 编译器)——

文章推荐： linux - 如何获取 LLVM 调试符号

文章推荐： c++ - 为 x64 使用 msvc 编译 libssh

IMAP 同步
我正在实现 IMAP 客户端，但 IMAP 邮箱同步出现问题。首先，可以从 IMAP 服务器获取新邮件，但我不知道如何从邮箱中查找已删除的邮件。我是否应该从服务器获取所有消息并将其与本地数据进行比
Java-同步
我研究线程同步。当我有这个例子时: class A { public synchronized void methodA(){ } public synchronized void met
Java——同步
嗨，我做了一个扩展线程的东西，它添加了一个包含 IP 的对象。然后我创建了该线程的两个实例并启动它们。他们使用相同的列表。我现在想使用 Synchronized 来阻止并发更新问题。但它不起作用，我
javascript - 同步
我正在尝试使用 FTP 定期将小数据文件从程序上传到服务器。用户从使用 javascript XMLHttpRequest 函数读取数据的网页访问数据。这一切似乎都有效，但我正在努力解决由 FTP 和
JavaScript 同步
我不知道如何同步下一个代码: javascript: (function() { var s2 = document.createElement('script'); s2.src =
Java 同步
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 7 年前。 Improve this qu
同步 EDA 框架设计
一点睛 1 Message 在基于 Message 的系统中，每一个 Event 也可以被称为 Message，Message 是对 Event 更高一个层级的抽象，每一个 Message 都有一个
同步 EDA 框架设计
一点睛 1 Message 在基于 Message 的系统中，每一个 Event 也可以被称为 Message，Message 是对 Event 更高一个层级的抽象，每一个 Message 都有一个
jquery - getJSON 同步
目标:我所追求的是每次在数据库中添加某些内容时(在 $.ajax 到 Submit_to_db.php 之后)，从数据库获取数据并刷新 main.php(通过 draw_polygon 更明显)。所
iphone - 同步 CAAnimations
我有一个重复动画，需要与其他一些 transient 动画同步。重复动画是一条在屏幕上移动 4 秒的扫描线。当它经过下面的图像时，这些图像需要“闪烁”。闪烁的图像可以根据用户的意愿来来去去和移动。它
cuda block 同步
我有 b 个块，每个块有 t 个线程。我可以用 __syncthreads() 同步特定块中的线程。例如 __global__ void aFunction() { for(i=0;i #
azure - Azure表实体存在/同步
我正在使用azure表查询来检索分配给用户的所有错误实体。此外，我更改了实体的属性以声明该实体处于处理模式。处理完实体后，我将从表中删除该实体。当我进行并行测试时，可能会发生查询期间，一个实体已
不同机器上的应用程序访问时的 SQLite 同步
我想知道 SQLite 是如何实现它的。它基于文件锁定吗？当然，并不是每个访问它的用户都锁定了整个数据库；那效率极低。它是基于多个文件还是仅基于一个大文件？如果有人能够简要概述一下 sqlite 中
javascript - jquery如何发布到php，同步
我想post到php，当id EmpAgree1时，然后它的post变量EmpAgree=1；当id为EmpAgree2时，则后置变量EmpAgree=2等。但只是读取i的最后一个值，为什么？以及如何
cuda - CUBLAS 同步
CUBLAS 文档提到我们在读取标量结果之前需要同步: “此外，少数返回标量结果的函数，例如 amax()、amin、asum()、rotg()、rotmg()、dot() 和 nrm2()，通过引用
Java RMI 同步
我知道下面的代码中缺少一些内容，我的问题是关于 RemoteImplementation 中的同步机制。我还了解到该网站和其他网站上有几个关于 RMI 和同步的问题；我在这里寻找明确的确认/矛盾。我
java - AOP+同步
我不太确定如何解决这个问题......所以我可能需要几次尝试才能正确回答这个问题。我有一个用于缓存方法结果的注释。我的代码目前是一个私有(private)分支，但我正在处理的部分从这里开始: http
java - java中的线程/同步
我对 Java 非常失望，因为它不允许以下代码尽可能地并发移动。当没有同步时，两个线程会更频繁地切换，但是当尝试访问同步方法时，在第二个线程获得锁之前以及在第一个线程获得锁之前再次花费太长时间(比如
java - Kotlin 同步
过去几周我一直在研究java多线程。我了解了synchronized，并理解synchronized避免了多个线程同时访问相同的属性。我编写此代码是为了在同一线程中运行两个线程。 val gate =
另一个线程内的 Java 同步
我有一个关于 Java 同步的简单问题。请假设以下代码: public class Test { private String address; private int age;

首页

博学

6Ren·AI

商城

c++ - openMP过度同步