c++ - 来自 MPI 的奇怪段错误-6ren

c++ - 来自 MPI 的奇怪段错误

转载作者：行者123 更新时间：2023-11-30 03:00:20

26

4

为了练习 MPI 用户定义的数据类型函数，我编写了一个简单的 MPI 程序。以下是抛出段错误的版本。

    #include <mpi.h>
    #include <iostream>

    using namespace std;

    int main( int argc , char ** argv )
    {
        int rank;

        MPI_Datatype newtype;
        MPI_Datatype newertype;

        MPI_Init(&argc,&argv);

        MPI_Comm_rank(MPI_COMM_WORLD,&rank);

        MPI_Type_contiguous(2,MPI_INT,&newtype);
        MPI_Type_commit(&newtype);
        MPI_Type_vector(3,2,3,newtype,&newertype);
        MPI_Type_commit(&newertype);    



        int * buffer = new int[16];

        for( int i=0 ; i<16 ; i++ )
        {
            buffer[i] = 0;
        }

        if(rank==0)
        {
            for( int i=0 ; i<16 ; i++ )
            {
                buffer[i] = 9;
            }

            MPI_Send(buffer,3,newertype,1,0,MPI_COMM_WORLD);        

        }else if(rank==1)
        {
            MPI_Recv(buffer,3,newertype,0,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE);

            for( int i=0 ; i<16 ; i++ )
            {
                cout << buffer[i] << " ";
            }

            cout << endl;

        }

        MPI_Type_free(&newertype);
        MPI_Type_free(&newtype);

        MPI_Finalize();

        return 0;
    }

但是，当数组声明移到 MPI_Init 之前时，一切正常。

#include <mpi.h>
#include <iostream>

using namespace std;

int main( int argc , char ** argv )
{
    int rank;

    **int * buffer = new int[16];

    for( int i=0 ; i<16 ; i++ )
    {
            buffer[i] = 0;
    }**

    MPI_Datatype newtype;
    MPI_Datatype newertype;

    MPI_Init(&argc,&argv);

    MPI_Comm_rank(MPI_COMM_WORLD,&rank);

    MPI_Type_contiguous(2,MPI_INT,&newtype);
    MPI_Type_commit(&newtype);
    MPI_Type_vector(3,2,3,newtype,&newertype);
    MPI_Type_commit(&newertype);    

    if(rank==0)
    {
        for( int i=0 ; i<16 ; i++ )
        {
            buffer[i] = 9;
        }

        MPI_Send(buffer,3,newertype,1,0,MPI_COMM_WORLD);        

    }else if(rank==1)
    {
        MPI_Recv(buffer,3,newertype,0,0,MPI_COMM_WORLD,MPI_STATUS_IGNORE);

        for( int i=0 ; i<16 ; i++ )
        {
            cout << buffer[i] << " ";
        }

        cout << endl;

    }

    MPI_Type_free(&newertype);
    MPI_Type_free(&newtype);

    MPI_Finalize();

    return 0;
}

谁能解释在 MPI_Init 调用后声明数组有什么问题？

For your information, below is the error message

9 9 9 9 0 0 9 9 9 9 0 0 9 9 9 9 
[linuxscc003:10019] *** Process received signal ***
[linuxscc003:10019] Signal: Segmentation fault (11)
[linuxscc003:10019] Signal code: Address not mapped (1)
[linuxscc003:10019] Failing at address: 0x7fa00d0b36c8 
[linuxscc003:10019] [ 0] /lib64/libpthread.so.0() [0x3abf80f500]
[linuxscc003:10019] [ 1] /opt/MPI/openmpi-1.5.3/linux/gcc/lib/libmpi.so.1(opal_memory_ptmalloc2_int_free+0x299) [0x7f980ce46509]
[linuxscc003:10019] [ 2] /opt/MPI/openmpi-1.5.3/linux/gcc/lib/libmpi.so.1(+0xe7b2b) [0x7f980ce46b2b]                            
[linuxscc003:10019] [ 3] /opt/MPI/openmpi-1.5.3/linux/gcc/lib/libmpi.so.1(+0xf0a60) [0x7f980ce4fa60]                            
[linuxscc003:10019] [ 4] /opt/MPI/openmpi-1.5.3/linux/gcc/lib/libmpi.so.1(mca_base_param_finalize+0x41) [0x7f980ce4f731]        
[linuxscc003:10019] [ 5] /opt/MPI/openmpi-1.5.3/linux/gcc/lib/libmpi.so.1(opal_finalize_util+0x1b) [0x7f980ce3f53b]             
[linuxscc003:10019] [ 6] /opt/MPI/openmpi-1.5.3/linux/gcc/lib/libmpi.so.1(+0x4ce35) [0x7f980cdabe35]                            
[linuxscc003:10019] [ 7] type_contiguous(main+0x1aa) [0x408f2e]                                                                 
[linuxscc003:10019] [ 8] /lib64/libc.so.6(__libc_start_main+0xfd) [0x3abec1ecdd]                                                
[linuxscc003:10019] [ 9] type_contiguous() [0x408cc9]                                                                           
[linuxscc003:10019] *** End of error message ***                                                                                
--------------------------------------------------------------------------                                                      
mpiexec noticed that process rank 1 with PID 10019 on node linuxscc003 exited on signal 11 (Segmentation fault).                
--------------------------------------------------------------------------                                                      
Failure executing command /opt/MPI/openmpi-1.5.3/linux/gcc/bin/mpiexec -x  LD_LIBRARY_PATH -x  PATH -x  OMP_NUM_THREADS -x  MPI_NAME --hostfile /tmp/hostfile-9252 -np 2 type_contiguous

最佳答案

newertype 有 3 个段，由 newtype 的 2 个元素组成，步幅为 3。您正在发送该类型的 3 个元素。这意味着从发送或接收操作期间访问的第一个元素到最后一个元素在内存中的跨度是 3*3*3 - 1(3 个元素，每个元素有 3 个元素的 3 段，减去 1因为对于最后一段，您只从 3 个元素中取出 2 个元素)或 26 个 newtype 类型的元素。每个 newtype 都是两个连续的 MPI_INT 元素。您的发送或接收缓冲区应至少为 52 整数，但您只分配了 16，因此等级 1 中的 MPI_Recv 正在写入超过分配的缓冲区，可能会覆盖堆控制结构。在调用 MPI_Init 之前移动分配会更改这些结构在内存中的顺序，您的代码现在正在覆盖一些不同但不重要的内容。该代码仍然不正确，您很幸运它没有出现段错误。使用更大的缓冲区(至少 52 个元素)。

关于c++ - 来自 MPI 的奇怪段错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12212476/

26

4

0

文章推荐： android - 如何使这段动画代码更有效？

文章推荐： java - 在java中打印BST中的所有路径

文章推荐： android - 聊天应用程序中的表情符号

文章推荐： c++ - 将函数从一个类发送到另一个类并在 C++ 中执行

mpi - 将 MPI 等级数推广到 MPI 组？
是否有等级编号对组编号的概括？对于我的代码，我想创建 MPI::COMM_WORLD 的分层分解。假设我们使用 16 个线程。我使用 MPI::COMM_WORLD.Split 创建 4 个通信器，每
mpi - 如何在多个节点中运行 MPI-Job？ (多节点 MPI 作业执行)
能够使用多个节点执行 MPI 作业以加快流程这是我目前使用的命令: mpirun --hostfile myhost -np 2 --map-by slot Job.x//只在第一个节点执行 mpi
mpi - 新的通信器无效的 MPI
我想创建一个新的通信器，它只保留处理中使用的行列，如果我有 24 个可用处理器而我只需要 10 个，那么该组应该只保留这 10 个，否则它将保留所有他们。出于某种原因，当我尝试创建一个通信器时，一切都
mpi - OpenMP 和 MPI 混合程序比纯 MPI 更快吗？
我正在开发一些程序，而不是在每个节点上有 4 个内核的 4 节点集群上运行。我有一个非常快的 OpenMP 版本的程序，它只在一个集群上运行，我正在尝试使用 MPI 扩展它。由于我的经验有限，我想知道
mpi - MPI 中的图像处理
这是我尝试在 MPI 中编写经典平滑像素平均算法的代码。我几乎让它工作了，但是光晕交换发生了一些奇怪的事情，因为可以看到边缘的线条。我似乎找不到错误。我是否正确地交换了光环？我应该收集最终数组的哪一部
mpi - 事件驱动的 MPI
我有兴趣使用 MPI(消息传递接口(interface))实现一种事件驱动的调度队列。我要解决的基本问题是:我有一个主进程，它将作业插入全局队列，每个可用的从进程检索队列中的下一个作业(如果有的话)。
mpi - MPI 运行时系统分配的进程的物理位置
当我们在集群上使用命令 say mpirun -np 4 a.out 启动 MPI 程序时，然后MPI 运行时系统如何跨 CPU 分配进程？我的意思是，假设它在集群中找到一个空闲的四核 CPU，它会
mpi - MPI 进程是如何启动的？
使用 mpirun 启动 MPI 作业时或 mpiexec ，我可以理解人们如何开始每个单独的过程。但是，如果没有任何编译器魔法，这些包装器可执行文件如何将安排(MPI 通信器)传达给 MPI 进程？
mpi - MPI 中的等级和进程有什么区别？
MPI 中的等级和进程有什么区别？最佳答案 Here是我从中学习所有 MPI 的资源，您可能会发现它很有用。关于你的问题:流程是正在运行的程序的实际实例。 MPI 允许您创建逻辑团体进程，并且
mpi - MPI 障碍的复杂性
MPI 障碍的时间复杂度是多少？它们是否可以扩展到大量核心(>> 10k)？最佳答案屏障复杂性与实现高度相关。它可以是线性的，可以是对数的，也可以是更好或更差。某些架构为某些集体操作提供专用网络，
mpi - MPI 死锁
我正在尝试 MPI，想知道这段代码是否会导致死锁。 MPI_Comm_rank (comm, &my_rank); if (my_rank == 0) { MPI_Send (sendbuf,
mpi - MPI 进程数可以超过节点上的逻辑处理器数
我有一个简单的 MPI 代码，可以打印出进程的等级，使用 Intel 编译器和 MPI 库进行编译和链接。然后我在集群的主节点上以交互方式运行它:mpiexec -n 50 ./a.out该节点只有
mpi - 在 open-mpi/mpi-run 中加载共享库
我正在尝试使用 mpi run 使用扭矩调度程序来运行我的程序。虽然在我的 pbs 文件中我通过加载了所有库 export LD_LIBRARY_PATH=/path/to/library 但它给出
mpi - 使用 MPI 合并所有等级的数组
我在所有等级上都有一个相同长度的数组(假设为 10)。数组中的某些值包含处理器的等级。例如 ... Proc 1: [1 0 0 0 0 1 0 0 0 1] Proc 2: [0 2 2 0 0 0
mpi - 按主机对 MPI 任务进行分组
我想在集群中的每台机器上独立地轻松执行集体通信。假设我有 4 台机器，每台机器有 8 个内核，我的 MPI 程序将运行 32 个 MPI 任务。对于给定的功能，我想要的是: 在每个主机上，只有一个任务
mpi - 有没有办法在 MPI 中获取唯一的通信器标识符？
我希望能够获得某个通信器的唯一 ID，但是当您通过 MPI_Comm_split() 调用获得此通信器时，这似乎是一项不可能完成的任务。我知道什么时候 MPI_Comm_split() 被集体调用，每
mpi - 非阻塞 MPI 调用的抽象实现
非阻塞发送/接收立即在 MPI 中返回，操作在后台完成。我看到这种情况发生的唯一方法是当前进程/线程调用/创建另一个进程/线程并将发送/接收代码的图像加载到其中并返回。然后这个新进程/线程完成这个操作
mpi - MPI I/O 是如何实现的？
冗长的背景我正在为心脏电生理学模拟并行处理一些代码。由于用户可以使用内置脚本语言指定他们自己的模拟，我无法知道如何在通信与计算之间进行权衡。为了解决这个问题，我正在制作一种运行时分析器，一旦看到要运
mpi - 使用 MPI 指定运行程序的机器
我打算做一些并行计算，我完全是这方面的初学者。我将使用 MPI 来完成并行工作，采用 Master-Slave 模型。我现在有四台机器，希望其中一台作为主节点。但是，我不知道如何指定运行该程序的其他机
mpi - 我们可以在单个系统中运行 MPI 程序还是必须只在集群中运行它？
我可以在我的大学使用 PelicanHPC 访问集群网络，其中运行各种 MPI 程序，但在家里我想练习编写/使用其他 MPI 程序。有没有办法在我自己的系统上运行 MPI 程序？ (我在 Ubuntu

首页

博学

6Ren·AI

商城

c++ - 来自 MPI 的奇怪段错误