gpt4 book ai didi

c - MPI 发送和接收死锁

转载 作者:太空宇宙 更新时间:2023-11-04 03:31:57 53 4
gpt4 key购买 nike

我是 MPI 的新手,我只是在编写一个基本的发送和接收模块,我在其中将 12 个月发送给 n 个处理器并接收每个月并打印其值。所以我能够正确发送值并且也能够接收所有值但是我的程序卡住了,即它最后没有打印“程序完成后”。你能帮忙吗?

#include <stdio.h>
#include <string.h>
#include "mpi.h"
#include<math.h>

int main(int argc, char* argv[]){
int my_rank; /* rank of process */
int p; /* number of processes */

int tag=0; /* tag for messages */

MPI_Status status ; /* return status for receive */
int i;
int pro;
/* start up MPI */

MPI_Init(&argc, &argv);

// find out process rank
MPI_Comm_rank(MPI_COMM_WORLD, &my_rank);

//find out number of processes
MPI_Comm_size(MPI_COMM_WORLD, &p);
if (my_rank==0)
{
for(i=1;i<=12;i++)
{
pro = (i-1)%p;
MPI_Send(&i, 1, MPI_INT,pro, tag, MPI_COMM_WORLD);
printf("Value of Processor is %d Month %d\n",pro,i);
}
}

//else{
for(int n=0;n<=p;n++)
{

MPI_Recv(&i, 1, MPI_INT, 0, tag, MPI_COMM_WORLD, &status);
printf("My Month is %d and rank is %d\n",i,my_rank);

}
//}
MPI_Barrier(MPI_COMM_WORLD);
if(my_rank==0)
{
printf("After program is complete\n");
}
/* shut down MPI */

MPI_Finalize();
return 0;
}

Below is the output:
Value of Processor is 0 Month 1
Value of Processor is 1 Month 2
Value of Processor is 2 Month 3
Value of Processor is 3 Month 4
Value of Processor is 4 Month 5
Value of Processor is 0 Month 6
Value of Processor is 1 Month 7
Value of Processor is 2 Month 8
Value of Processor is 3 Month 9
Value of Processor is 4 Month 10
Value of Processor is 0 Month 11
My Month is 2 and rank is 1
My Month is 7 and rank is 1
My Month is 3 and rank is 2
My Month is 8 and rank is 2
Value of Processor is 1 Month 12
My Month is 1 and rank is 0
My Month is 6 and rank is 0
My Month is 11 and rank is 0
My Month is 12 and rank is 1
My Month is 4 and rank is 3
My Month is 9 and rank is 3
My Month is 5 and rank is 4
My Month is 10 and rank is 4

最佳答案

第一:您违反了 MPI 的基本规则之一,您必须将一个发送与一个接收相匹配。

在您的示例运行中,您使用 5 个处理器(等级)运行,如您所见,等级 0 向等级 0 发送 3 条消息,向其余等级发送 1 和 2 条消息。但是,每个级别的职位有13个接收。所以他们自然会陷入等待从未发送的消息。请记住,围绕 MPI_Recv 循环的代码被各级执行。所以总共会有 5 * 13 次接收。

如果轮到接收,您可以通过在循环内过滤来解决这个问题。但这取决于您是否真的事先知道等级 0 将发送多少消息 - 您可能需要更复杂的机制。

第二:您排名 0 向自己发送阻塞消息(没有先发布非阻塞接收)。这已经可能导致僵局。请记住 MPI_Send永远不会保证在匹配的接收被发布之前返回,即使它有时在实践中可能会。

第三:那个循环 for(int n=0;n<=p;n++)运行 13 次。你肯定不想要那个,即使你运行 12 次它是不正确的。

最后:对于特定示例,首选解决方案是将月份保存在数组中并使用 MPI_Scatterv 将其分布在所有进程中.

关于c - MPI 发送和接收死锁,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35754224/

53 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com