c++ - OpenMP - Easy Loop，但仍然是无限的？-6ren

c++ - OpenMP - Easy Loop，但仍然是无限的？

转载作者：塔克拉玛干更新时间：2023-11-03 00:45:40

26

4

我在 C++ 代码中使用 OpenMP 时遇到一个非常奇怪的问题:

void update(double *source, double *target, int n)
{
    target[0] = source[0];
    target[n-1] = source[n-1];
    #pragma omp parallel for 
    for(int i = 1; i < n-1; ++i) 
        target[i] = (1.0/3.0) * (source[i-1] + source[i] + source[i+1]);
}

源和目标都是具有 n 个元素的 double 组。在没有 OpenMP 的情况下使用代码时，代码工作正常。但是一旦我使用 pragma，代码似乎就陷入了这个循环。问题是:我完全不知道为什么。希望有人能帮助我

最佳答案

n有多大？

OpenMP parallel for 指令的默认调度是特定于实现的。它看起来像在 GOMP(gcc 使用的 OpenMP 实现)中，根据 documentation here 默认是 (dynamic,1) .这意味着每个线程都在访问(在 i-1 和 i+1)由相邻线程加载的内存位置，这可能导致缓存利用率低下。在现代 CPU 架构上，像这样的模板操作通常受内存限制并且对缓存敏感。您可以尝试指定具有更大块的时间表，例如:

#pragma omp parallel for schedule(dynamic,1024)

我这里仅以 1024 为例。在实践中，您应该尝试找到最佳分块因子(或使用参数扫描系统地搜索，这个过程通常称为“自动调整”)。或者您可以选择一个更基于理论的值，例如从您的 CPU 的 L1 或 L2 缓存大小中得出它。

或者您可以改为尝试静态调度，因为 for 循环内的计算量在线程之间是统一的，动态调度程序的开销可能会导致瓶颈。如果你指定

#pragma omp parallel for schedule(static)

没有 block 大小，那么每个线程将被分配一个大小大致相同的 block 。

最后，您可能还想将 OpenMP 线程固定到它们自己的 CPU 内核上。您可以使用 GOMP_CPU_AFFINITY 执行此操作环境变量。

编辑:

我只是在玩以下用 gcc 4.2.1 编译的测试程序，我认为上面链接的文档不正确。看起来 GOMP 默认为 schedule(static)。

#include <stdio.h>
#include <omp.h>

int main(int argc, char** argv)
{
    int i;
    #pragma omp parallel for
    for (i=0; i<15; i++) {
        int id = omp_get_thread_num();
        printf("%d assigned to thread %d\n", i, id);
    }
}

两个线程的输出是:

$ ./test_sched | sort -n
0 assigned to thread 0
1 assigned to thread 0
2 assigned to thread 0
3 assigned to thread 0
4 assigned to thread 0
5 assigned to thread 0
6 assigned to thread 0
7 assigned to thread 0
8 assigned to thread 1
9 assigned to thread 1
10 assigned to thread 1
11 assigned to thread 1
12 assigned to thread 1
13 assigned to thread 1
14 assigned to thread 1

关于c++ - OpenMP - Easy Loop，但仍然是无限的？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8041193/

26

4

0

文章推荐： mysql - Percona 5.6 Docker 镜像无法加载 my/etc/mysql/conf.d/*.cnf

文章推荐： android - WebRTC 本地信令服务器

文章推荐： c++ - _HUGE 和 __IMP__HUGE 在 "math.h"

文章推荐： Android Drive api 下载文件

javascript - 如何使列表项滚动动画看起来连续/无限
我有 3 个列表项，每 3 秒向上旋转一次。我正在使用 transformY 属性来做这件事。问题是，当它到达最后一个元素时，它会循环返回，从而产生重新开始的效果。如何通过在最后一项之后继续向上旋转
无限/重复世界的数学/计算与旋转
我如何制作一个处理旋转的无限/重复世界，就像在这个游戏中一样: http://bloodfromastone.co.uk/retaliation.html 我通过具有这样的层次结构对我的旋转移动世界进
javascript - 是否可以不限制字符重复的正则表达式范围的上限值(无限)？
这个问题已经有答案了: Using explicitly numbered repetition instead of question mark, star and plus (4 个回答) 已关闭
java - 无限 while 循环以及读取文件时出现问题
程序说明: I have this program of mine which is intended to read every word from a file (large one) and t
java - 无限 While 循环
while 循环应该比较这两个对象的 ibsn。正在比较的对象: list[0] = new ReadingMatter ("Words and Stuff", "9-082-1090-1");
JavaScript 无限 For 循环
已关闭。这个问题是 not reproducible or was caused by typos 。目前不接受答案。这个问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-top
c - 无限 while 循环中的信号
我完全被屏蔽了。我尝试修改 C 中的“警报”信号，以便在秒数到期时读取一个简单的变量。我的代码如下: 在主要部分: int semnal; signal(SIGALRM, alarmHandle
Java 无限 While 循环
我正在接受多行信息(字符串，直到我稍后解析它们)。例如: 1 5 0 2 9 6 2 9 1 我编写这段代码来分隔行，因为我将不得不以某种方式操作每一行。 Scanner scan = new Sca
javascript - 如何制作动态名称选择器(无限)
我不熟悉 jQuery，并且我有多余的 jQuery 调用，我想将它们放入循环中。 $('.class1').on('click', function () { ... $('.class2').on
php - 广度优先搜索方式的一般树遍历(无限)
我有一个树结构，其中每个节点都有 5 个子节点，并且不允许超过 5 个。我希望以广度优先搜索的方式遍历这棵树。现在我想使用广度优先搜索方式从选定的父节点计算空节点。例如如果给定的父节点为 1，则
PHP 无限 while 循环阻止对脚本的其他调用
目标/动机我想写一个服务，它应该一直运行。但是当服务已经运行时，应该不可能再次启动该服务。用例用户 X 打开页面 myService.php 并通过单击页面上的按钮启动服务。之后关闭浏览器。一段
c++ - “无限”未在此范围内声明
我正在尝试编译 shogun 工具箱，但遇到了这个错误 C:/shogun-3.0.0/shogun-3.0.0/src/shogun/../shogun/mathematics/Math.h
javascript - 无限 6 面骰子滚轮
需要学校的 JavaScript 作业帮助，但不知道该怎么做，希望得到一些提示？我们应该创建一个 6 面掷骰子程序，用户可以选择应该掷多少个骰子，最少 1 个和最多 5 个骰子。所用骰子数量的总和
iphone - 无限 ScrollView 的动画
我在无限 ScrollView 中有 5 张图片。因此，为了使 scrollView 无限/循环，我将图像定位如下: 5 1 2 3 4 5 1含义:最后一张图片第一张图片第二张图片.....最后一
elixir - 如何中断(无限)流？
我正在使用 ExTwitter库，并希望能够偶尔终止对流式 API 的调用以更改参数。我当前的代码看起来像这样: for tweet #finished end 关于elixir - 如何中断(无
Javascript/jQuery - 动画背景随着淡入淡出而变化(无限)
我想每 3 秒更改一次 div 的背景。这需要循环，因此一旦最后一个背景图像显示，它就会循环回到第一个背景图像，依此类推。我在这样做时遇到了麻烦。我之前发过一篇文章，内容非常模糊，没有得到帮助。
javascript - AngularJS:无限$digest循环错误？
我在做this教程，无法让我的页面正确加载。我不断在控制台中收到错误:[$rootScope:infdig]。我对 Angular 很陌生，但从我读到的内容来看，我在某个地方有一个无限循环。我预计它
javascript - 无限 asyncIterator 未按预期工作
所以我试图创建一个无限的 asyncIterator/生成器。该代码应该为“for wait of”循环生成“Hello”和“Hi”，然后永远等待下一个值。问题是它不等待第三个值，也不在循环后打印 2
javascript - 无限 Canvas 背景滚动无卡顿
下图显示了我如何在 HTML5/JS 中制作无限背景滚动。我的连续背景由 X block Canvas 组成。我将在到达下一个 Canvas 之前立即渲染它，并释放上一个 Canvas。这里的问题是动
storage - 无限(或非常高)长度的整数存储
作为一个业余项目，我正在研究一些自制的素数生成问题，尝试编写一些不同的实现作为自学 C 和 C++ 的方法。当然，生成低素数的最快方法是已经拥有它们，所以我想着手建立一个硬盘素数列表数据文件。我想编写

首页

博学

6Ren·AI

商城

c++ - OpenMP - Easy Loop，但仍然是无限的？