- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在编写一些代码,使用 openmp 对矩阵进行行缩减。我有两个版本,都让我的 Ubuntu 和 Fedora 安装崩溃。硬是指我的鼠标和键盘没有响应,即使我按下 PC 塔上的重置按钮,它也不会重新启动。我必须按住电源按钮。奇怪的是代码在运行几分钟后就崩溃了。它不会消耗大量内存(我认为 750 MB 很小,因为我有 16 GB 的内存)。
#include <iostream>
#include <cstddef>
#include <cstring>
#include <iomanip>
#include <cstdlib>
#include <ctime>
#include <cmath>
using namespace std;
class Matrix
{
public:
Matrix(size_t rows, size_t cols):
data(0), w(rows), h(cols)
{
data = new double[w * h];
memset(data, 0, sizeof(double) * w * h);
}
~Matrix()
{
if(data)
{
delete[] data;
w = h = 0;
data = 0;
}
}
double* operator[](size_t row)
{
return data + row * w;
}
const double* operator[](size_t row) const
{
return data + row * w;
}
size_t width() const
{
return w;
}
size_t height() const
{
return h;
}
void scale_row(size_t row, double x)
{
double* prow = (*this)[row];
for(size_t i = 0; i < w; i++)
prow[i] *= x;
}
void add_row(size_t dest_row, size_t source_row, double scaling = 1.0)
{
if(dest_row == source_row)
{
scale_row(dest_row, 1.0 + scaling);
return;
}
double* __restrict__ drow = (*this)[dest_row];
double* __restrict__ srow = (*this)[source_row];
for(size_t i = 0; i < w; i++)
drow[i] += srow[i] * scaling;
}
void swap_rows(size_t r1, size_t r2)
{
if(r1 == r2)
return;
double* __restrict__ a = (*this)[r1];
double* __restrict__ b = (*this)[r2];
#pragma omp parallel for simd
for(size_t i = 0; i < w; i++)
{
double tmp = a[i];
a[i] = b[i];
b[i] = tmp;
}
}
double* find_leading(size_t row)
{
double* ptr = (*this)[row];
for(size_t i = 0; i < w; i++)
if(ptr[i])
return ptr + i;
return 0;
}
void clamp_zeros(double threshold = 1e-12)
{
#pragma omp parallel for simd
for(size_t i = 0; i < w * h; i++)
{
if(fabs(data[i]) < threshold)
data[i] = 0;
}
}
void row_reduce(Matrix* mirror = 0)
{
for(size_t r1 = 0; r1 < h; r1++)
{
double* lead = find_leading(r1);
if(!lead)
continue;
size_t rank = lead - (*this)[r1];
if(mirror)
mirror->scale_row(r1, 1.0 / *lead);
scale_row(r1, 1.0 / *lead);
#pragma omp parallel for
for(size_t r2 = 0; r2 < h; r2++)
{
if(r2 == r1 || (*this)[r2][rank] == 0)
continue;
if(mirror)
mirror->add_row(r2, r1, -(*this)[r2][rank]);
add_row(r2, r1, -(*this)[r2][rank]);
}
clamp_zeros();
}
size_t zero_count = 0;
for(size_t r = 0; r < h; r++)
{
double* lead = find_leading(r);
if(lead)
{
size_t rank = lead - (*this)[r];
swap_rows(rank, r);
if(mirror)
mirror->swap_rows(rank, r);
}
else
{
size_t with = h - ++zero_count;
swap_rows(r, with);
if(mirror)
mirror->swap_rows(r, with);
}
}
}
private:
double* data;
size_t w, h;
};
ostream& operator<<(ostream& o, const Matrix& m)
{
o << setprecision(2);
for(size_t j = 0; j < m.width(); j++)
{
o << "----------";
}
o << "--\n";
for(size_t i = 0; i < m.height(); i++)
{
o << "|";
for(size_t j = 0; j < m.width(); j++)
{
o << setw(10) << m[i][j];
}
o << "|\n";
}
for(size_t j = 0; j < m.width(); j++)
{
o << "----------";
}
o << "--";
return o;
}
int main()
{
srand(time(0));
Matrix m (10000, 10000);
for(int i = 0; i < m.height(); i++)
{
for(int j = 0; j < m.width(); j++)
{
m[i][j] = rand() % 100;
}
}
time_t start = time(0);
m.row_reduce();
time_t end = time(0);
cout << m[0][2] << endl;
cout << "dt = " << (end - start) << endl;
return 0;
}
我还尝试了另一种愚蠢的简单 omp 程序,看看它是否会使我的系统崩溃,而这个不会。
double sum = 0.0;
double start = omp_get_wtime();
#pragma omp parallel for reduction(+:sum)
for(long long i = 1; i < 100000000000000LL; i++)
{
sum += 1.0 / ((double)i * i);
}
printf("%lf %lf\n", omp_get_wtime() - start, sum);
我尝试了第一个,当我在用 gcc 4.9 编译的 Ubuntu 15.04 和用 gcc 5.1 编译的 Fedora 22 上运行时遇到了同样的问题。
当我在没有 openmp 的情况下运行它时,它工作正常。此外,如果我尝试较小的数据,如 2000x2000 矩阵,它工作正常(当我尝试 10,000x10,000 矩阵时发生崩溃)。
似乎在我的笔记本电脑上运行良好,它也运行 ubuntu 15.04。
最佳答案
我对代码进行了一些更改以支持与 OpenMP 2.0 的兼容性,我可以告诉您,您的代码运行良好(Windows 7、Visual Studio 2008)。内存消耗约 800MB。
输出:
0
dt = 2881
这是您修改后的代码。
////////////////////////////////////////////////////////////////
// OpenMP test function
#include <iostream>
#include <cstddef>
#include <cstring>
#include <iomanip>
#include <cstdlib>
#include <ctime>
#include <cmath>
#include <omp.h>
using namespace std;
class Matrix
{
public:
Matrix(size_t rows, size_t cols):
data(0), w(rows), h(cols)
{
data = new double[w * h];
memset(data, 0, sizeof(double) * w * h);
}
~Matrix()
{
if(data)
{
delete[] data;
w = h = 0;
data = 0;
}
}
double* operator[](size_t row)
{
return data + row * w;
}
const double* operator[](size_t row) const
{
return data + row * w;
}
size_t width() const
{
return w;
}
size_t height() const
{
return h;
}
void scale_row(size_t row, double x)
{
double* prow = (*this)[row];
for(size_t i = 0; i < w; i++)
prow[i] *= x;
}
void add_row(size_t dest_row, size_t source_row, double scaling = 1.0)
{
if(dest_row == source_row)
{
scale_row(dest_row, 1.0 + scaling);
return;
}
double* drow = (*this)[dest_row];
double* srow = (*this)[source_row];
for(size_t i = 0; i < w; i++)
drow[i] += srow[i] * scaling;
}
void swap_rows(size_t r1, size_t r2)
{
if(r1 == r2)
return;
double* a = (*this)[r1];
double* b = (*this)[r2];
#pragma omp parallel for schedule(dynamic)
for(int i = 0; i < w; i++)
{
double tmp = a[i];
a[i] = b[i];
b[i] = tmp;
}
}
double* find_leading(size_t row)
{
double* ptr = (*this)[row];
for(int i = 0; i < w; i++)
if(ptr[i])
return ptr + i;
return 0;
}
void clamp_zeros(double threshold = 1e-12)
{
#pragma omp parallel for schedule(dynamic)
for(int i = 0; i < w * h; i++)
{
if(fabs(data[i]) < threshold)
data[i] = 0;
}
}
void row_reduce(Matrix* mirror = 0)
{
for(size_t r1 = 0; r1 < h; r1++)
{
double* lead = find_leading(r1);
if(!lead)
continue;
size_t rank = lead - (*this)[r1];
if(mirror)
mirror->scale_row(r1, 1.0 / *lead);
scale_row(r1, 1.0 / *lead);
#pragma omp parallel for schedule(dynamic)
for(int r2 = 0; r2 < h; r2++)
{
if(r2 == r1 || (*this)[r2][rank] == 0)
continue;
if(mirror)
mirror->add_row(r2, r1, -(*this)[r2][rank]);
add_row(r2, r1, -(*this)[r2][rank]);
}
clamp_zeros();
}
size_t zero_count = 0;
for(size_t r = 0; r < h; r++)
{
double* lead = find_leading(r);
if(lead)
{
size_t rank = lead - (*this)[r];
swap_rows(rank, r);
if(mirror)
mirror->swap_rows(rank, r);
}
else
{
size_t with = h - ++zero_count;
swap_rows(r, with);
if(mirror)
mirror->swap_rows(r, with);
}
}
}
private:
double* data;
size_t w, h;
};
ostream& operator<<(ostream& o, const Matrix& m)
{
o << setprecision(2);
for(size_t j = 0; j < m.width(); j++)
{
o << "----------";
}
o << "--\n";
for(size_t i = 0; i < m.height(); i++)
{
o << "|";
for(size_t j = 0; j < m.width(); j++)
{
o << setw(10) << m[i][j];
}
o << "|\n";
}
for(size_t j = 0; j < m.width(); j++)
{
o << "----------";
}
o << "--";
return o;
}
int main()
{
int iMaxThreads = omp_get_max_threads();
omp_set_num_threads(iMaxThreads);
omp_set_dynamic(false);
omp_set_nested(true);
srand(time(0));
Matrix m (10000, 10000);
for(int i = 0; i < m.height(); i++)
{
for(int j = 0; j < m.width(); j++)
{
m[i][j] = rand() % 100;
}
}
time_t start = time(0);
m.row_reduce();
time_t end = time(0);
cout << m[0][2] << endl;
cout << "dt = " << (end - start) << endl;
return 0;
}
关于c++ - 此 OpenMP 代码使 Linux 崩溃,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33091435/
我有一段代码看起来像这样: void update_clock(uint8_t *time_array) { time_t time = *((time_t *) &time_array[0]
应用程序崩溃了 :( 请帮助我.. 在这方面失败了。我找不到错误?该应用程序可以连接到 iTunesConnect 但它会出错。 谁能根据下面的崩溃报告判断问题出在哪里? share_with_app
小二是新来的实习生,作为技术 leader,我给他安排了一个非常简单的练手任务,把前端 markdown 编辑器里上传的图片保存到服务器端,结果他真的就把图片直接保存到了服务器上,这下可把我气坏了,就
我正在创建一个函数,它将目录路径作为参数传递,或者如果它留空,则提示用户输入。 我已经设置了我的 PATH_MAX=100 和 if 语句来检查 if ((strlen(folder path) +
我已将“arial.ttf”文件(从我的/Windows/Fonts 文件夹中获取)加载到内存中,但是将其传递到 FT_New_Memory_Face 时会崩溃(在 FT_Open_Face 中的某处
我正在尝试在我的计算机上的两个控制台之间进行 rtsp 流。 在控制台 1 上,我有: ffmpeg -rtbufsize 100M -re -f dshow -s 320x240 -i video=
我正在尝试使用 scio_beast在一个项目中。我知道它还没有完成,但这并不重要。我已经设法让它工作得很好。 我现在正在尝试连接到 CloudFlare 后面的服务器,我知道我需要 SNI 才能工作
我有一个带有关联宏的下拉列表,如下所示: Sub Drop() If Range("Hidden1!A1") = "1" Then Sheets("Sheet1").Se
我对 bash 很陌生。我要做的就是运行这个nvvp -vm /usr/lib64/jvm/jre-1.8.0/bin/java无需记住最后的路径。我认为 instafix 就是这样做...... n
我在 Windows 上使用 XAMPP 已经两年左右了,它运行完美,没有崩溃没有问题。 (直到四个月前。) 大约四个月前,我们将服务器/系统升级到了更快的规范。 这是旧规范的内容 - Windows
我面临着一个非常烦人的 android 崩溃,它发生在大约 1% 的 PRODUCTION session 中,应用程序始终在后台运行。 Fatal Exception: android.app.Re
尝试使用下面的函数: public void createObjectType() { try { mCloudDB.createObjectType(ObjectTypeIn
由于我正在进行的一个项目,我在 CF11 管理员中弄乱了类路径,我设法使服务器崩溃,以至于我唯一得到的是一个漂亮的蓝屏和 500 错误.我已经检查了日志,我会把我能做的贴在帖子的底部,但我希望有人会启
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 10 个月前关闭。 Improve
我最近从 xcode 3.x 更新到 4.2,当我在 4.2 中运行应用程序时,我遇到了核心数据问题。我还更新到了 iOS 5,所以问题可能就在那里,我不太确定。 这些应用程序在 3.x 中运行良好,
我是一个相对较新的 iPhone 应用程序开发人员,所以我的知识有点粗略,所以如果这是一个微不足道的问题,请原谅我。 我有一个导航应用程序,它通过在navigationController对象上调用p
if ([MFMailComposeViewController canSendMail]) { MFMailComposeViewController *mailViewController
你能帮我吗? 我正在设置 UILocalNotification,当我尝试设置其 userInfo 字典时,它崩溃了。 fetchedObjects 包含 88 个对象。 这是代码: NSDi
为什么我的代码中突然出现 NSFastEnumeration Mutation Handler 崩溃。我很茫然为什么会突然出现这个崩溃以及如何解决它。 最佳答案 崩溃错误: **** 由于未捕获的异常
当我从表中删除行时,我的应用程序崩溃了。这是我检测到错误和堆栈跟踪的来源。谢谢! //delete row from database - (void)tableView:(UITableView *
我是一名优秀的程序员,十分优秀!