c++ - MPI c++ 环形拓扑发送和接收不同的值，同时只传递相同的值？-6ren

c++ - MPI c++ 环形拓扑发送和接收不同的值，同时只传递相同的值？

转载作者：塔克拉玛干更新时间：2023-11-03 07:11:33

我正在学习 C++ 中的环形拓扑 MPI。我编写了一个 C++ 脚本来计算 10 维蒙特卡洛积分并计算其均值和局部最大值。我的目标是通过“环”传递每个处理器的局部最大值。

现在，我仍然没有弄清楚如何将不同处理器在运行时产生的最大值存储在一个数组中，所以我编译并执行了一次代码，然后手动将这些值组成一个数组。

接下来我想通过环传递每个数组值，并最终计算出全局最大值。现在我只是尝试传递第一个数组值，我看到处理器发送相同的值但接收不同的值。老实说，我不知道 c++ 使用 MPI 库的方式是否不同，我遵循了 MPI 的在线教程和 C，并且在我的 c++ 代码中使用了与 C 相同的结构。

我在这里分享代码。

#include <iostream>
#include <fstream>
#include <iomanip>
#include <cmath>
#include <cstdlib>
#include <ctime>
#include <mpi.h>
using namespace std;


//define multivariate function F(x1, x2, ...xk)            

double f(double x[], int n)
{
    double y;
    int j;
    y = 0.0;

    for (j = 0; j < n-1; j = j+1)
      {
         y = y + exp(-pow((1-x[j]),2)-100*(pow((x[j+1] - pow(x[j],2)),2)));

      }     

    y = y;
    return y;
}

//define function for Monte Carlo Multidimensional integration

double int_mcnd(double(*fn)(double[],int),double a[], double b[], int n, int m)

{
    double r, x[n], v;
    int i, j;
    r = 0.0;
    v = 1.0;
    // initial seed value (use system time) 
    //srand(time(NULL)); 


    // step 1: calculate the common factor V
    for (j = 0; j < n; j = j+1)
      {
         v = v*(b[j]-a[j]);
      } 

    // step 2: integration
    for (i = 1; i <= m; i=i+1)
    {
        // calculate random x[] points
        for (j = 0; j < n; j = j+1)
        {
            x[j] = a[j] +  (rand()) /( (RAND_MAX/(b[j]-a[j])));
        }         
        r = r + fn(x,n);
    }
    r = r*v/m;

    return r;
}




double f(double[], int);
double int_mcnd(double(*)(double[],int), double[], double[], int, int); 



int main(int argc, char **argv)
{    

    int rank, size;

    MPI_Init (&argc, &argv);      // initializes MPI
    MPI_Comm_rank (MPI_COMM_WORLD, &rank); // get current MPI-process ID. O, 1, ...
    MPI_Comm_size (MPI_COMM_WORLD, &size); // get the total number of processes


    /* define how many integrals */
    const int n = 10;       

    double b[n] = {5.0, 5.0, 5.0, 5.0, 5.0, 5.0, 5.0, 5.0, 5.0,5.0};                    
    double a[n] = {-5.0, -5.0, -5.0, -5.0, -5.0, -5.0, -5.0, -5.0, -5.0,-5.0};  

    double result, mean;
    int m;

    const unsigned int N = 5;
    double max = -1;


    cout.precision(6);
    cout.setf(ios::fixed | ios::showpoint); 


    srand(time(NULL) * rank);  // each MPI process gets a unique seed

    m = 4;                // initial number of intervals

    // convert command-line input to N = number of points
    //N = atoi( argv[1] );


    for (unsigned int  i=0; i <=N; i++)
    {
        result = int_mcnd(f, a, b, n, m);
        mean = result/(pow(10,10));

        if( mean > max) 
        {
         max = mean;
        }
        //cout << setw(10)  << m << setw(10) << max << setw(10) << mean << setw(10) << rank << setw(10) << size <<endl;
        m = m*4; 
    }

    //cout << setw(30)  << m << setw(30) << result << setw(30) << mean <<endl; 
    printf("Process %d of %d mean = %1.5e\n and local max = %1.5e\n", rank, size, mean, max );


    double max_store[4] = {4.43095e-02, 5.76586e-02, 3.15962e-02, 4.23079e-02}; 

    double send_junk = max_store[0];
    double rec_junk;
    MPI_Status status;


  // This next if-statment implemeents the ring topology
  // the last process ID is size-1, so the ring topology is: 0->1, 1->2, ... size-1->0
  // rank 0 starts the chain of events by passing to rank 1
  if(rank==0) {
    // only the process with rank ID = 0 will be in this block of code.
    MPI_Send(&send_junk, 1, MPI_INT, 1, 0, MPI_COMM_WORLD); //  send data to process 1
    MPI_Recv(&rec_junk, 1, MPI_INT, size-1, 0, MPI_COMM_WORLD, &status); // receive data from process size-1
  }
  else if( rank == size-1) { 
    MPI_Recv(&rec_junk, 1, MPI_INT, rank-1, 0, MPI_COMM_WORLD, &status); // recieve data from process rank-1 (it "left" neighbor")
    MPI_Send(&send_junk, 1, MPI_INT, 0, 0, MPI_COMM_WORLD); // send data to its "right neighbor", rank 0
  }
  else {
    MPI_Recv(&rec_junk, 1, MPI_INT, rank-1, 0, MPI_COMM_WORLD, &status); // recieve data from process rank-1 (it "left" neighbor")
    MPI_Send(&send_junk, 1, MPI_INT, rank+1, 0, MPI_COMM_WORLD); // send data to its "right neighbor" (rank+1)
  }
  printf("Process %d send %1.5e\n and recieved %1.5e\n", rank, send_junk, rec_junk ); 


  MPI_Finalize(); // programs should always perform a "graceful" shutdown
    return 0;
}

我编译了:

mpiCC -std=c++11 -o hg test_code.cpp
mpirun -np 4 ./hg

输出看起来像这样，当然 mean amd max 不同，但我现在担心 send 和 recvd 值:

Process 2 of 4 mean = 2.81817e-02
 and local max = 5.61707e-02
Process 0 of 4 mean = 2.59220e-02
 and local max = 4.43095e-02
Process 3 of 4 mean = 2.21734e-02
 and local max = 4.30539e-02
Process 1 of 4 mean = 2.87403e-02
 and local max = 6.58530e-02
Process 1 send 4.43095e-02
 and recieved 2.22181e-315
Process 2 send 4.43095e-02
 and recieved 6.90945e-310
Process 3 send 4.43095e-02
 and recieved 6.93704e-310
Process 0 send 4.43095e-02
 and recieved 6.89842e-310

我想我搞砸了 C 和 C++ 中的 MPI 用法，我将不胜感激任何建议，而且我没有在互联网上看到任何好的 C++ MPI 教程，所以我的代码或教程链接的一个很好的修改示例将很有帮助。谢谢

最佳答案

MPI_Recv 的第三个参数和 MPI_Send是数据类型。现在您正在发送 double但您将数据类型设置为 MPI_INT .在大多数系统中int是 4 个字节和 double是 8 个字节，因此 rec_junk 中的一半字节未初始化。

要修复它，只需更改 MPI_INT至 MPI_DOUBLE在MPI_Recv的所有电话中和 MPI_Send .

关于c++ - MPI c++ 环形拓扑发送和接收不同的值，同时只传递相同的值？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40584459/

文章推荐： c++ - Debug模式或 Release模式

文章推荐： c++ - 使用 HElib 进行比较？

文章推荐： c++ - std::vector 异常是中立的吗？

文章推荐： c++ - 在 C++ 中使用 scanLine() 方法存储所有 QImage 的像素

mpi - 将 MPI 等级数推广到 MPI 组？
是否有等级编号对组编号的概括？对于我的代码，我想创建 MPI::COMM_WORLD 的分层分解。假设我们使用 16 个线程。我使用 MPI::COMM_WORLD.Split 创建 4 个通信器，每
mpi - 如何在多个节点中运行 MPI-Job？ (多节点 MPI 作业执行)
能够使用多个节点执行 MPI 作业以加快流程这是我目前使用的命令: mpirun --hostfile myhost -np 2 --map-by slot Job.x//只在第一个节点执行 mpi
mpi - 新的通信器无效的 MPI
我想创建一个新的通信器，它只保留处理中使用的行列，如果我有 24 个可用处理器而我只需要 10 个，那么该组应该只保留这 10 个，否则它将保留所有他们。出于某种原因，当我尝试创建一个通信器时，一切都
mpi - OpenMP 和 MPI 混合程序比纯 MPI 更快吗？
我正在开发一些程序，而不是在每个节点上有 4 个内核的 4 节点集群上运行。我有一个非常快的 OpenMP 版本的程序，它只在一个集群上运行，我正在尝试使用 MPI 扩展它。由于我的经验有限，我想知道
mpi - MPI 中的图像处理
这是我尝试在 MPI 中编写经典平滑像素平均算法的代码。我几乎让它工作了，但是光晕交换发生了一些奇怪的事情，因为可以看到边缘的线条。我似乎找不到错误。我是否正确地交换了光环？我应该收集最终数组的哪一部
mpi - 事件驱动的 MPI
我有兴趣使用 MPI(消息传递接口(interface))实现一种事件驱动的调度队列。我要解决的基本问题是:我有一个主进程，它将作业插入全局队列，每个可用的从进程检索队列中的下一个作业(如果有的话)。
mpi - MPI 运行时系统分配的进程的物理位置
当我们在集群上使用命令 say mpirun -np 4 a.out 启动 MPI 程序时，然后MPI 运行时系统如何跨 CPU 分配进程？我的意思是，假设它在集群中找到一个空闲的四核 CPU，它会
mpi - MPI 进程是如何启动的？
使用 mpirun 启动 MPI 作业时或 mpiexec ，我可以理解人们如何开始每个单独的过程。但是，如果没有任何编译器魔法，这些包装器可执行文件如何将安排(MPI 通信器)传达给 MPI 进程？
mpi - MPI 中的等级和进程有什么区别？
MPI 中的等级和进程有什么区别？最佳答案 Here是我从中学习所有 MPI 的资源，您可能会发现它很有用。关于你的问题:流程是正在运行的程序的实际实例。 MPI 允许您创建逻辑团体进程，并且
mpi - MPI 障碍的复杂性
MPI 障碍的时间复杂度是多少？它们是否可以扩展到大量核心(>> 10k)？最佳答案屏障复杂性与实现高度相关。它可以是线性的，可以是对数的，也可以是更好或更差。某些架构为某些集体操作提供专用网络，
mpi - MPI 死锁
我正在尝试 MPI，想知道这段代码是否会导致死锁。 MPI_Comm_rank (comm, &my_rank); if (my_rank == 0) { MPI_Send (sendbuf,
mpi - MPI 进程数可以超过节点上的逻辑处理器数
我有一个简单的 MPI 代码，可以打印出进程的等级，使用 Intel 编译器和 MPI 库进行编译和链接。然后我在集群的主节点上以交互方式运行它:mpiexec -n 50 ./a.out该节点只有
mpi - 在 open-mpi/mpi-run 中加载共享库
我正在尝试使用 mpi run 使用扭矩调度程序来运行我的程序。虽然在我的 pbs 文件中我通过加载了所有库 export LD_LIBRARY_PATH=/path/to/library 但它给出
mpi - 使用 MPI 合并所有等级的数组
我在所有等级上都有一个相同长度的数组(假设为 10)。数组中的某些值包含处理器的等级。例如 ... Proc 1: [1 0 0 0 0 1 0 0 0 1] Proc 2: [0 2 2 0 0 0
mpi - 按主机对 MPI 任务进行分组
我想在集群中的每台机器上独立地轻松执行集体通信。假设我有 4 台机器，每台机器有 8 个内核，我的 MPI 程序将运行 32 个 MPI 任务。对于给定的功能，我想要的是: 在每个主机上，只有一个任务
mpi - 有没有办法在 MPI 中获取唯一的通信器标识符？
我希望能够获得某个通信器的唯一 ID，但是当您通过 MPI_Comm_split() 调用获得此通信器时，这似乎是一项不可能完成的任务。我知道什么时候 MPI_Comm_split() 被集体调用，每
mpi - 非阻塞 MPI 调用的抽象实现
非阻塞发送/接收立即在 MPI 中返回，操作在后台完成。我看到这种情况发生的唯一方法是当前进程/线程调用/创建另一个进程/线程并将发送/接收代码的图像加载到其中并返回。然后这个新进程/线程完成这个操作
mpi - MPI I/O 是如何实现的？
冗长的背景我正在为心脏电生理学模拟并行处理一些代码。由于用户可以使用内置脚本语言指定他们自己的模拟，我无法知道如何在通信与计算之间进行权衡。为了解决这个问题，我正在制作一种运行时分析器，一旦看到要运
mpi - 使用 MPI 指定运行程序的机器
我打算做一些并行计算，我完全是这方面的初学者。我将使用 MPI 来完成并行工作，采用 Master-Slave 模型。我现在有四台机器，希望其中一台作为主节点。但是，我不知道如何指定运行该程序的其他机
mpi - 我们可以在单个系统中运行 MPI 程序还是必须只在集群中运行它？
我可以在我的大学使用 PelicanHPC 访问集群网络，其中运行各种 MPI 程序，但在家里我想练习编写/使用其他 MPI 程序。有没有办法在我自己的系统上运行 MPI 程序？ (我在 Ubuntu

塔克拉玛干

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - MPI c++ 环形拓扑发送和接收不同的值，同时只传递相同的值？