- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我试图理解为什么 OpenMP 以其在以下示例中的方式工作。
#include <omp.h>
#include <iostream>
#include <vector>
#include <stdlib.h>
void AddVectors (std::vector< double >& v1,
std::vector< double >& v2) {
size_t i;
#pragma omp parallel for private(i)
for (i = 0; i < v1.size(); i++) v1[i] += v2[i];
}
int main (int argc, char** argv) {
size_t N1 = atoi(argv[1]);
std::vector< double > v1(N1,1);
std::vector< double > v2(N1,2);
for (size_t i = 0; i < N1; i++) AddVectors(v1,v2);
return 0;
}
我首先在没有启用 OpenMP 的情况下编译了上面的代码(通过省略编译标志上的 -fopenmp)。 N1 = 10000 的执行时间为 0.1 秒。启用 OpenMP 会使执行时间超过 1 分钟。我在它完成之前就停止了它(厌倦了等待...)。
我正在编译如下代码:
g++ -std=c++0x -O3 -funroll-loops -march=core2 -fomit-frame-pointer -Wall -fno-strict-aliasing -o main.o -c main.cpp
g++ main.o -o main
并非所有这些标志在这里都是必需的,但我在我尝试并行化的项目中使用了它们,并且我在那里使用了这些标志。这就是为什么我决定把它们留在这里。此外,我添加了 -fopenmp 以在编译时启用 OpenMP。
有人知道怎么回事吗?谢谢!
最佳答案
我在 Visual Studio 2008 上尝试过相同的示例。我对您的代码示例进行了两次修改,使用 OpenMP 时它的运行速度比不使用 OpenMP 时快大约 3 倍。
无法在 GCC 上确认,问题可能出在调用函数 AddVectors 的主循环中,并且每次它都必须执行“fork”操作,这将花费一些可测量的时间。因此,如果您有 N1 = 10000,它必须产生 10000 个“fork”操作。
我附上了你自己的代码片段,只是为了让它在 Visual Studio 下工作而修改的,我在最后添加了一条打印语句,以避免编译器删除所有代码。
#include <omp.h>
#include <iostream>
#include <vector>
#include <stdlib.h>
void AddVectors (std::vector< double >& v1,
std::vector< double >& v2) {
#pragma omp parallel for
for (int i = 0; i < static_cast<int>(v1.size()); i++) v1[i] += v2[i];
}
int main (int argc, char** argv) {
size_t N1 = atoi(argv[1]);
std::vector< double > v1(N1,1);
std::vector< double > v2(N1,2);
for (size_t i = 0; i < N1; i++) AddVectors(v1,v2);
printf("%g\n",v1[0]);
return 0;
}
关于c++ - 为什么 OpenMP 在这种情况下很慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5397004/
我是 Java 新手,这是我的代码, if( a.name == b.name && a.displayname == b.displayname && a.linknam
在下面的场景中,我有一个 bool 值。根据结果,我调用完全相同的函数,唯一的区别是参数的数量。 var myBoolean = ... if (myBoolean) { retrieve
我是一名研究 C++ 的 C 开发人员: 我是否正确理解如果我抛出异常然后堆栈将展开直到找到第一个异常处理程序?是否可以在不展开的情况下在任何 throw 上打开调试器(即不离开声明它的范围或任何更高
在修复庞大代码库中的错误时,我观察到一个奇怪的情况,其中引用的动态类型从原始 Derived 类型更改为 Base 类型!我提供了最少的代码来解释问题: struct Base { // some
我正在尝试用 C# 扩展给定的代码,但由于缺乏编程经验,我有点陷入困境。 使用 Visual Studio 社区,我尝试通过控制台读出 CPU 核心温度。该代码使用开关/外壳来查找传感器的特定名称(即
这可能是一个哲学问题。 假设您正在向页面发出 AJAX 请求(这是使用 Prototype): new Ajax.Request('target.asp', { method:"post", pa
我有以下 HTML 代码,我无法在所有浏览器中正常工作: 我试图在移动到
我对 Swift 很陌生。我如何从 addPin 函数中检索注释并能够在我的 addLocation 操作 (buttonPressed) 中使用它。我正在尝试使用压力触摸在 map 上添加图钉,在两
我设置了一个详细 View ,我是否有几个 Nib 文件根据在 Root View Controller 的表中选择的项目来加载。 我发现,对于 Nibs 的类,永远不会调用 viewDidUnloa
我需要动态访问 json 文件并使用以下代码。在本例中,“bpicsel”和“temp”是变量。最终结果类似于“data[0].extit1” var title="data["+bpicsel+"]
我需要使用第三方 WCF 服务。我已经在我的证书存储中配置了所需的证书,但是在调用 WCF 服务时出现以下异常。 向 https://XXXX.com/AHSharedServices/Custome
在几个 SO 答案(1、2)中,建议如果存在冲突则不应触发 INSERT 触发器,ON CONFLICT DO NOTHING 在触发语句中。也许我理解错了,但在我的实验中似乎并非如此。 这是我的 S
如果进行修改,则会给出org.hibernate.NonUniqueObjectException。在我的 BidderBO 类(class)中 @Override @Transactional(pr
我使用 indexOf() 方法来精细地查找数组中的对象。 直到此刻我查了一些资料,发现代码应该无法正常工作。 我在reducer中尝试了上面的代码,它成功了 let tmp = state.find
假设我有以下表格: CREATE TABLE Game ( GameID INT UNSIGNED NOT NULL, GameType TINYINT UNSIGNED NOT NU
代码: Alamofire.request(URL(string: imageUrl)!).downloadProgress(closure: { (progress) in
我是一名优秀的程序员,十分优秀!