c++ - 此 OpenMP 代码使 Linux 崩溃-6ren

c++ - 此 OpenMP 代码使 Linux 崩溃

转载作者：太空狗更新时间：2023-10-29 12:01:41

我正在编写一些代码，使用 openmp 对矩阵进行行缩减。我有两个版本，都让我的 Ubuntu 和 Fedora 安装崩溃。硬是指我的鼠标和键盘没有响应，即使我按下 PC 塔上的重置按钮，它也不会重新启动。我必须按住电源按钮。奇怪的是代码在运行几分钟后就崩溃了。它不会消耗大量内存(我认为 750 MB 很小，因为我有 16 GB 的内存)。

#include <iostream>
#include <cstddef>
#include <cstring>
#include <iomanip>
#include <cstdlib>
#include <ctime>
#include <cmath>

using namespace std;

class Matrix
{
    public:

    Matrix(size_t rows, size_t cols):
        data(0), w(rows), h(cols)
    {
        data = new double[w * h];
        memset(data, 0, sizeof(double) * w * h);
    }

    ~Matrix()
    {
        if(data)
        {
            delete[] data;
            w = h = 0;
            data = 0;
        }
    }

    double* operator[](size_t row)
    {
        return data + row * w;
    }

    const double* operator[](size_t row) const
    {
        return data + row * w;
    }

    size_t width() const
    {
        return w;
    }

    size_t height() const
    {
        return h;
    }

    void scale_row(size_t row, double x)
    {
        double* prow = (*this)[row];

        for(size_t i = 0; i < w; i++)
            prow[i] *= x;
    }

    void add_row(size_t dest_row, size_t source_row, double scaling = 1.0)
    {
        if(dest_row == source_row)
        {
            scale_row(dest_row, 1.0 + scaling);
            return;
        }

        double* __restrict__ drow = (*this)[dest_row];
        double* __restrict__ srow = (*this)[source_row];

        for(size_t i = 0; i < w; i++)
            drow[i] += srow[i] * scaling;
    }

    void swap_rows(size_t r1, size_t r2)
    {
        if(r1 == r2)
            return;

        double* __restrict__ a = (*this)[r1];
        double* __restrict__ b = (*this)[r2];

        #pragma omp parallel for simd
        for(size_t i = 0; i < w; i++)
        {
            double tmp = a[i];
            a[i] = b[i];
            b[i] = tmp;
        }
    }

    double* find_leading(size_t row)
    {
        double* ptr = (*this)[row];
        for(size_t i = 0; i < w; i++)
            if(ptr[i])
                return ptr + i;
        return 0;
    }

    void clamp_zeros(double threshold = 1e-12)
    {
        #pragma omp parallel for simd
        for(size_t i = 0; i < w * h; i++)
        {
            if(fabs(data[i]) < threshold)
                data[i] = 0;
        }
    }

    void row_reduce(Matrix* mirror = 0)
    {
        for(size_t r1 = 0; r1 < h; r1++)
        {
            double* lead = find_leading(r1);
            if(!lead)
                continue;

            size_t rank = lead - (*this)[r1];
            if(mirror)
                mirror->scale_row(r1, 1.0 / *lead);
            scale_row(r1, 1.0 / *lead);

            #pragma omp parallel for
            for(size_t r2 = 0; r2 < h; r2++)
            {
                if(r2 == r1 || (*this)[r2][rank] == 0)
                    continue;
                if(mirror)
                    mirror->add_row(r2, r1, -(*this)[r2][rank]);
                add_row(r2, r1, -(*this)[r2][rank]);
            }
            clamp_zeros();
        }

        size_t zero_count = 0;
        for(size_t r = 0; r < h; r++)
        {
            double* lead = find_leading(r);
            if(lead)
            {
                size_t rank = lead - (*this)[r];
                swap_rows(rank, r);
                if(mirror)
                    mirror->swap_rows(rank, r);
            }
            else
            {
                size_t with = h - ++zero_count;
                swap_rows(r, with);
                if(mirror)
                    mirror->swap_rows(r, with);
            }
        }
    }

    private:

    double* data;
    size_t w, h;
};

ostream& operator<<(ostream& o, const Matrix& m)
{
    o << setprecision(2);
    for(size_t j = 0; j < m.width(); j++)
    {
        o << "----------";
    }
    o << "--\n";
    for(size_t i = 0; i < m.height(); i++)
    {
        o << "|";
        for(size_t j = 0; j < m.width(); j++)
        {
            o << setw(10) << m[i][j];
        }
        o << "|\n";
    }
    for(size_t j = 0; j < m.width(); j++)
    {
        o << "----------";
    }
    o << "--";
    return o;
}

int main()
{
    srand(time(0));
    Matrix m (10000, 10000);

    for(int i = 0; i < m.height(); i++)
    {
        for(int j = 0; j < m.width(); j++)
        {
            m[i][j] = rand() % 100;
        }
    }

    time_t start = time(0);
    m.row_reduce();
    time_t end = time(0);
    cout << m[0][2] << endl;
    cout << "dt = " << (end - start) << endl;
    return 0;
}

我还尝试了另一种愚蠢的简单 omp 程序，看看它是否会使我的系统崩溃，而这个不会。

double sum = 0.0;

double start = omp_get_wtime();
#pragma omp parallel for reduction(+:sum)
for(long long i = 1; i < 100000000000000LL; i++)
{
    sum += 1.0 / ((double)i * i);
}
printf("%lf %lf\n", omp_get_wtime() - start, sum);

我尝试了第一个，当我在用 gcc 4.9 编译的 Ubuntu 15.04 和用 gcc 5.1 编译的 Fedora 22 上运行时遇到了同样的问题。

当我在没有 openmp 的情况下运行它时，它工作正常。此外，如果我尝试较小的数据，如 2000x2000 矩阵，它工作正常(当我尝试 10,000x10,000 矩阵时发生崩溃)。

似乎在我的笔记本电脑上运行良好，它也运行 ubuntu 15.04。

最佳答案

我对代码进行了一些更改以支持与 OpenMP 2.0 的兼容性，我可以告诉您，您的代码运行良好(Windows 7、Visual Studio 2008)。内存消耗约 800MB。

输出:

dt = 2881

这是您修改后的代码。

////////////////////////////////////////////////////////////////
// OpenMP test function
#include <iostream>
#include <cstddef>
#include <cstring>
#include <iomanip>
#include <cstdlib>
#include <ctime>
#include <cmath>
#include <omp.h>

using namespace std;

class Matrix
{
    public:

    Matrix(size_t rows, size_t cols):
        data(0), w(rows), h(cols)
    {
        data = new double[w * h];
        memset(data, 0, sizeof(double) * w * h);
    }

    ~Matrix()
    {
        if(data)
        {
            delete[] data;
            w = h = 0;
            data = 0;
        }
    }

    double* operator[](size_t row)
    {
        return data + row * w;
    }

    const double* operator[](size_t row) const
    {
        return data + row * w;
    }

    size_t width() const
    {
        return w;
    }

    size_t height() const
    {
        return h;
    }

    void scale_row(size_t row, double x)
    {
        double* prow = (*this)[row];

        for(size_t i = 0; i < w; i++)
            prow[i] *= x;
    }

    void add_row(size_t dest_row, size_t source_row, double scaling = 1.0)
    {
        if(dest_row == source_row)
        {
            scale_row(dest_row, 1.0 + scaling);
            return;
        }

        double*  drow = (*this)[dest_row];
        double*  srow = (*this)[source_row];

        for(size_t i = 0; i < w; i++)
            drow[i] += srow[i] * scaling;
    }

    void swap_rows(size_t r1, size_t r2)
    {
        if(r1 == r2)
            return;

        double*  a = (*this)[r1];
        double*  b = (*this)[r2];

        #pragma omp parallel for schedule(dynamic)
        for(int i = 0; i < w; i++)
        {
            double tmp = a[i];
            a[i] = b[i];
            b[i] = tmp;
        }
    }

    double* find_leading(size_t row)
    {
        double* ptr = (*this)[row];
        for(int i = 0; i < w; i++)
            if(ptr[i])
                return ptr + i;
        return 0;
    }

    void clamp_zeros(double threshold = 1e-12)
    {
        #pragma omp parallel for schedule(dynamic)
        for(int i = 0; i < w * h; i++)
        {
            if(fabs(data[i]) < threshold)
                data[i] = 0;
        }
    }

    void row_reduce(Matrix* mirror = 0)
    {
        for(size_t r1 = 0; r1 < h; r1++)
        {
            double* lead = find_leading(r1);
            if(!lead)
                continue;

            size_t rank = lead - (*this)[r1];
            if(mirror)
                mirror->scale_row(r1, 1.0 / *lead);
            scale_row(r1, 1.0 / *lead);

            #pragma omp parallel for schedule(dynamic)
            for(int r2 = 0; r2 < h; r2++)
            {
                if(r2 == r1 || (*this)[r2][rank] == 0)
                    continue;
                if(mirror)
                    mirror->add_row(r2, r1, -(*this)[r2][rank]);
                add_row(r2, r1, -(*this)[r2][rank]);
            }
            clamp_zeros();
        }

        size_t zero_count = 0;
        for(size_t r = 0; r < h; r++)
        {
            double* lead = find_leading(r);
            if(lead)
            {
                size_t rank = lead - (*this)[r];
                swap_rows(rank, r);
                if(mirror)
                    mirror->swap_rows(rank, r);
            }
            else
            {
                size_t with = h - ++zero_count;
                swap_rows(r, with);
                if(mirror)
                    mirror->swap_rows(r, with);
            }
        }
    }

    private:

    double* data;
    size_t w, h;
};

ostream& operator<<(ostream& o, const Matrix& m)
{
    o << setprecision(2);
    for(size_t j = 0; j < m.width(); j++)
    {
        o << "----------";
    }
    o << "--\n";
    for(size_t i = 0; i < m.height(); i++)
    {
        o << "|";
        for(size_t j = 0; j < m.width(); j++)
        {
            o << setw(10) << m[i][j];
        }
        o << "|\n";
    }
    for(size_t j = 0; j < m.width(); j++)
    {
        o << "----------";
    }
    o << "--";
    return o;
}

int main()
{
    int iMaxThreads = omp_get_max_threads();
    omp_set_num_threads(iMaxThreads);

    omp_set_dynamic(false);
    omp_set_nested(true);

    srand(time(0));
    Matrix m (10000, 10000);

    for(int i = 0; i < m.height(); i++)
    {
        for(int j = 0; j < m.width(); j++)
        {
            m[i][j] = rand() % 100;
        }
    }

    time_t start = time(0);
    m.row_reduce();
    time_t end = time(0);
    cout << m[0][2] << endl;
    cout << "dt = " << (end - start) << endl;
    return 0;
}

关于c++ - 此 OpenMP 代码使 Linux 崩溃，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33091435/

文章推荐： Java/Scala 与 Linux native 的非阻塞 (http) io

文章推荐： html - CSS 中的属性值区分大小写吗？

文章推荐： CSS :first-of-type isn't working

从阵列转换导致某些 MCU 崩溃，但不会导致其他 MCU 崩溃
我有一段代码看起来像这样: void update_clock(uint8_t *time_array) { time_t time = *((time_t *) &time_array[0]
IOS 崩溃 - 崩溃 EXC_CRASH (SIGABRT) - 错误 109
应用程序崩溃了 :( 请帮助我.. 在这方面失败了。我找不到错误？该应用程序可以连接到 iTunesConnect 但它会出错。谁能根据下面的崩溃报告判断问题出在哪里？ share_with_app
崩溃，我带的实习生把图片直接存到了服务器上
小二是新来的实习生，作为技术 leader，我给他安排了一个非常简单的练手任务，把前端 markdown 编辑器里上传的图片保存到服务器端，结果他真的就把图片直接保存到了服务器上，这下可把我气坏了，就
检查输入字符串是否超过缓冲区限制(崩溃)
我正在创建一个函数，它将目录路径作为参数传递，或者如果它留空，则提示用户输入。我已经设置了我的 PATH_MAX=100 和 if 语句来检查 if ((strlen(folder path) +
FreeType FT_New_Memory_Face 崩溃
我已将“arial.ttf”文件(从我的/Windows/Fonts 文件夹中获取)加载到内存中，但是将其传递到 FT_New_Memory_Face 时会崩溃(在 FT_Open_Face 中的某处
FFmpeg RTSP 崩溃
我正在尝试在我的计算机上的两个控制台之间进行 rtsp 流。在控制台 1 上，我有: ffmpeg -rtbufsize 100M -re -f dshow -s 320x240 -i video=
c++ - SSL_set_tlsext_host_name 崩溃
我正在尝试使用 scio_beast在一个项目中。我知道它还没有完成，但这并不重要。我已经设法让它工作得很好。我现在正在尝试连接到 CloudFlare 后面的服务器，我知道我需要 SNI 才能工作
从下拉列表更改工作表时 VBA 崩溃
我有一个带有关联宏的下拉列表，如下所示: Sub Drop() If Range("Hidden1!A1") = "1" Then Sheets("Sheet1").Se
执行定义与现有命令相同的函数的脚本时，Bash 崩溃
我对 bash 很陌生。我要做的就是运行这个nvvp -vm /usr/lib64/jvm/jre-1.8.0/bin/java无需记住最后的路径。我认为 instafix 就是这样做...... n
增加系统规范时 Apache 崩溃
我在 Windows 上使用 XAMPP 已经两年左右了，它运行完美，没有崩溃没有问题。 (直到四个月前。) 大约四个月前，我们将服务器/系统升级到了更快的规范。这是旧规范的内容 - Windows
在某些后台应用程序中发生 Android 崩溃
我面临着一个非常烦人的 android 崩溃，它发生在大约 1% 的 PRODUCTION session 中，应用程序始终在后台运行。 Fatal Exception: android.app.Re
android - 华为云数据库创建对象类型()崩溃
尝试使用下面的函数: public void createObjectType() { try { mCloudDB.createObjectType(ObjectTypeIn
ColdFusion 11 崩溃
由于我正在进行的一个项目，我在 CF11 管理员中弄乱了类路径，我设法使服务器崩溃，以至于我唯一得到的是一个漂亮的蓝屏和 500 错误.我已经检查了日志，我会把我能做的贴在帖子的底部，但我希望有人会启
升级后 Metasploit 崩溃
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 10 个月前关闭。 Improve
iphone - NSPersistentStoreCoordinator 崩溃
我最近从 xcode 3.x 更新到 4.2，当我在 4.2 中运行应用程序时，我遇到了核心数据问题。我还更新到了 iOS 5，所以问题可能就在那里，我不太确定。这些应用程序在 3.x 中运行良好，
iphone - popToRootViewController 崩溃
我是一个相对较新的 iPhone 应用程序开发人员，所以我的知识有点粗略，所以如果这是一个微不足道的问题，请原谅我。我有一个导航应用程序，它通过在navigationController对象上调用p
iphone - MFMailComposeViewController 崩溃
if ([MFMailComposeViewController canSendMail]) { MFMailComposeViewController *mailViewController
iphone - UILocalNotification 崩溃
你能帮我吗？我正在设置 UILocalNotification，当我尝试设置其 userInfo 字典时，它崩溃了。 fetchedObjects 包含 88 个对象。这是代码: NSDi
iphone - NSFastEnumerationMutationHandler 崩溃
为什么我的代码中突然出现 NSFastEnumeration Mutation Handler 崩溃。我很茫然为什么会突然出现这个崩溃以及如何解决它。最佳答案崩溃错误: **** 由于未捕获的异常
iphone - deleteRowsAtIndexPaths 崩溃
当我从表中删除行时，我的应用程序崩溃了。这是我检测到错误和堆栈跟踪的来源。谢谢! //delete row from database - (void)tableView:(UITableView *

太空狗

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - 此 OpenMP 代码使 Linux 崩溃