gpt4 book ai didi

c - 使用非阻塞 MPI 函数发送矩阵的问题

转载 作者:太空宇宙 更新时间:2023-11-04 03:36:13 29 4
gpt4 key购买 nike

以下代码使用双指针 malloc 方法创建矩阵 [m][n] 并将相等数量的矩阵 block 发送到 n-1 中的每个 block 使用非阻塞 MPI 函数的处理器。处理器 P=0 负责生成矩阵并发送它们,这样每个 P != 0 处理器将接收一组行并处理它们。

尽管我花了好几天时间确保每一行都是正确的,但是我不知道这些错误是从哪里来的,但代码还是不起作用:(我很感激任何帮助。

#include <stdio.h> 
#include <string.h>
#include <time.h>
#include "mpi.h"

int main (int argc, char* argv[]) {

const int RANK_0 = 0; // Rank 0
const int ROWS = 24; // Row size
const int COLS = 12; // Column size
const int TAG_0 = 0; // Message ID
const int TAG_0 = 0; // Message ID
int rank; // The process ID
int P; // Number of Processors

/* MPI Initialisation */
MPI_Init(&argc, &argv);

MPI_Comm_rank(MPI_COMM_WORLD, &rank);
MPI_Comm_size(MPI_COMM_WORLD, &P);

/* Each client processor receives ROWS/P set of arrays */
if(rank != RANK_0){

int i,j;
int chunckSize= ROWS/P;

MPI_Request *req[chunckSize]; // Requests
MPI_Request *req1[chunckSize]; // Requests
MPI_Status status[chunckSize];
int ptr[chunckSize];

int **buffRecv= malloc(chunckSize * sizeof(int *));

for (i = 0; i < chunckSize ; i++) {
buffRecv[i] = malloc(COLS * sizeof(int));

MPI_Irecv(&ptr[i], 1, MPI_INT, RANK_0, TAG_1, MPI_COMM_WORLD, req1[i]);
MPI_Irecv(buffRecv[i], COLS, MPI_INT, RANK_0, TAG_0, MPI_COMM_WORLD, req[i]);
MPI_Wait(req1[i], MPI_STATUSES_IGNORE);
MPI_Wait(req[i], MPI_STATUSES_IGNORE);
}

printf("\n ===> Processor %d has recieved his set of rows, now start calculation: \n", rank);

for(i = 0; i< chunckSize; i++){
// print arrays row by row or do something

}

printf("\n Rank %d has done its tasks \n", rank);


}
else
{
/* MASTER PROCESS*/

int n=0;
int k,i,j,dest,offset;
int inc=1;
MPI_Request *req[ROWS]; // Requests
MPI_Request *req1[ROWS]; // Requests
int chunkSize= ROWS/P;

int **buf= malloc(ROWS * sizeof(int *));

offset = chunkSize;
for(dest = P; dest >= 0; dest--){

// ROWS/P rows to each destination
for (i = n; i < offset; i++)
{
buf[i] = malloc(COLS * sizeof(int));

for (j = 0; j < COLS; j++)
{
buf[i][j]=1;
}

if(dest == 0)
{

// rank_0 chunk will be handled here
}

else
{
MPI_Isend(&i, 1, MPI_INT, dest, TAG_1, MPI_COMM_WORLD, req1[i]);
MPI_Isend(buf[i], COLS, MPI_INT, dest, TAG_0, MPI_COMM_WORLD, req[i]);
}

}

// Print the result after each ROWS/P rows is sent
if(dest != 0){
printf("Row[%d] to Row[%d] is sent to rank# %d\n", n, k, dest);
}

n=offset;
offset= offset + chunkSize;

}
}

MPI_Finalize();
}

最佳答案

这段代码中有很多问题,稍后我将尝试列举。但我认为最重要的一点是,请求的发送永远不会等待,并且会从一个目的地重新利用到下一个目的地。这是非常错误的,因为没有测试或等待点,发送操作很可能永远不会发生。我暂时留给你,然后慢慢编辑我的答案。

编辑:好了,现在让我们一步一步来:

  1. 内存管理:由于您计划将数据 block 分配给您的进程,因此最好最大化每次传输的大小,从而最小化传输次数。但是要一次性传输矩阵中的几行,您需要将数据连续存储在内存中。要在保持 [i][j] 双括号访问简单性的同时实现这一点,您需要:首先为数据分配所需的整个存储空间,其次,分配一个指向此的指针数据,您将在每一行的每个起始索引上指出...这将如下所示:

    int **matrix = malloc( ROWS * sizeof( int* ) );
    matrix[0] = malloc( COLS * ROWS * sizeof( int ) );
    for ( int i = 1; i < ROWS; i++ ) {
    matrix[i] = matrix[i-1] + COLS;
    }

    这远不是主要问题,但这是另一次的好技巧。

  2. 请求问题:如前所述,您的发送请求没有等待,这是错误的。在您使用 MPI_Wait()MPI_Waitall() 等待它之前,或者在您使用 MPI_Testxxx( ) 函数。最简单的是在这里使用一个MPI_Waitall()

  3. 进程 #0 呢?它发送给自己,但永远不会收到发送的内容...

  4. 我没有检查 block 大小和偏移量,但我很确定如果进程数不能除以行数,您就会有麻烦。

  5. 最后(希望如此),您在此处尝试执行的操作非常符合 MPI_Scatter() 或可能是 MPI_Scatterv()。现在你的内存是线性存储的,看看它应该正好解决你的问题。

希望这对您有所帮助。

关于c - 使用非阻塞 MPI 函数发送矩阵的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32540738/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com