mpi - 为什么当消息确定发送时 MPI

mpi - 为什么当消息确定发送时 MPI_Iprobe 返回 false？

转载作者：行者123 更新时间：2023-12-04 02:02:14

我想使用 MPI_Iprobe 来测试带有给定标签的消息是否已经挂起。

但是，MPI_Iprobe 的行为并不像我预期的那样。
在下面的示例中，我将消息从多个任务发送到单个任务(等级 0)。然后在等级 0 上，我等待几秒钟，让 MPI_Isends 有足够的时间完成。然后，当我运行 MPI_Iprobe 时，它返回标志为 false。如果我在(阻塞)MPI_Probe 之后重复，那么它返回 true。

#include "mpi.h"
#include <stdio.h>
#include <unistd.h>

int main(int argc, char *argv[])
{
  int rank;
  int numprocs;
  int tag;
  int receive_tag;
  int flag=0;
  int number;
  int recv_number=0;

  MPI_Request request;
  MPI_Status status;

  MPI_Init(&argc,&argv);
  MPI_Comm_rank(MPI_COMM_WORLD,&rank);
  MPI_Comm_size(MPI_COMM_WORLD,&numprocs);

  // rank 0 receives messages, all others send messages
  if (rank > 0 ) {
    number = rank;
    tag = rank;
    MPI_Isend(&number, 1, MPI_INT, 0, tag, MPI_COMM_WORLD,&request); // send to rank 0
    printf("Sending tag : %d \n",tag);
   } 
   else if (rank == 0) {

   sleep(5); // [seconds] allow plenty of time for all sends from other tasks to complete

   receive_tag = 3; // just try and receive a single message from task 1

   MPI_Iprobe(MPI_ANY_SOURCE,receive_tag,MPI_COMM_WORLD,&flag,&status);
   printf("After MPI_Iprobe, flag = %d \n",flag);

   MPI_Probe(MPI_ANY_SOURCE,receive_tag,MPI_COMM_WORLD,&status);
   printf("After MPI_Probe, found message with tag : %d \n",receive_tag);

   MPI_Iprobe(MPI_ANY_SOURCE,receive_tag,MPI_COMM_WORLD,&flag,&status);
   printf("After second MPI_Iprobe, flag = %d \n",flag);

   // receive all the messages
   for (int i=1;i<numprocs;i++){    
     MPI_Recv(&recv_number, 1, MPI_INT, MPI_ANY_SOURCE, i, MPI_COMM_WORLD,&status);
     printf("Received : %d \n",recv_number);
   }

 }
 MPI_Finalize();
}

给出这个输出:

Sending tag : 4 
Sending tag : 3 
Sending tag : 2 
Sending tag : 5 
Sending tag : 1 
After MPI_Iprobe, flag = 0 
After MPI_Probe, found message with tag : 3 
After second MPI_Iprobe, flag = 1 
Received : 1 
Received : 2 
Received : 3 
Received : 4 
Received : 5

为什么 mpi_iprobe 第一次返回“false”？

任何帮助将非常感激!

编辑:在 Hristo Iliev 的回答之后，我现在有以下代码:

#include "mpi.h"
#include <stdio.h>
#include <unistd.h>

int main(int argc, char *argv[])
{
  int rank;
  int numprocs;
  int tag;
  int receive_tag;
  int flag=0;
  int number;
  int recv_number=0;

  MPI_Request request;
  MPI_Status status;

  MPI_Init(&argc,&argv);
  MPI_Comm_rank(MPI_COMM_WORLD,&rank);
  MPI_Comm_size(MPI_COMM_WORLD,&numprocs);

  // rank 0 receives messages, all others send messages
  if (rank > 0 ) {
    number = rank;
    tag = rank;

    MPI_Isend(&number, 1, MPI_INT, 0, tag, MPI_COMM_WORLD,&request); // send to rank 0
    printf("Sending tag : %d \n",tag);

    // do stuff

    MPI_Wait(&request,&status);
    printf("Sent tag : %d \n",tag);

   }
    else if (rank == 0) {

    sleep(5); // [seconds] allow plenty of time for all sends from other tasks to complete

    receive_tag = 3; // just try and receive a single message from task 1

    MPI_Iprobe(MPI_ANY_SOURCE,receive_tag,MPI_COMM_WORLD,&flag,&status);
    printf("After MPI_Iprobe, flag = %d \n",flag);

    MPI_Probe(MPI_ANY_SOURCE,receive_tag,MPI_COMM_WORLD,&status);
    printf("After MPI_Probe, found message with tag : %d \n",receive_tag);

    MPI_Iprobe(MPI_ANY_SOURCE,receive_tag,MPI_COMM_WORLD,&flag,&status);
    printf("After second MPI_Iprobe, flag = %d \n",flag);

    // receive all the other messages
    for (int i=1;i<numprocs;i++){   
       MPI_Recv(&recv_number, 1, MPI_INT, MPI_ANY_SOURCE, i, MPI_COMM_WORLD,&status);
    }

 }
 MPI_Finalize();
}

这给出了以下输出:

Sending tag : 5 
Sending tag : 2 
Sending tag : 1 
Sending tag : 4 
Sending tag : 3 
Sent tag : 2 
Sent tag : 1 
Sent tag : 5 
Sent tag : 4 
Sent tag : 3 
After MPI_Iprobe, flag = 0 
After MPI_Probe, found message with tag : 3 
After second MPI_Iprobe, flag = 1

最佳答案

您正在使用 MPI_Isend为了发送消息。 MPI_Isend启动异步(后台)数据传输。实际数据传输可能不会发生，除非 MPI_Wait* 之一或 MPI_Test*已按要求调用电话。一些 MPI 实现具有(或可以配置为)后台进程线程，即使没有对请求进行等待/测试，它们也会继续发送操作，但不应依赖这种行为。

只需更换 MPI_Isend与 MPI_Send或添加 MPI_Wait(&request);在前者之后(请注意，MPI_Isend + MPI_Wait 紧随其后相当于 MPI_Send )。
MPI_Iprobe旨在用于繁忙的等待，即:

while (condition)
{
   MPI_Iprobe(...,&flag,...);
   if (flag)
   {
      MPI_Recv(...);
      ...
   }
   // Do something, e.g. background tasks
}

实际 MPI 实现中的真实消息传输是相当复杂的事情。操作通常分成多个部分，然后排队。执行该部分称为进程，它在 MPI 库中的各个点完成，例如，当进行通信调用时，或者如果库实现了后台进程线程，则在后台执行。调用 MPI_Iprobe肯定会取得进展，但不能保证一个电话就足够了。 MPI 标准规定:

The MPI implementation of MPI_PROBE and MPI_IPROBE needs to guarantee progress: if a call to MPI_PROBE has been issued by a process, and a send that matches the probe has been initiated by some process, then the call to MPI_PROBE will return, unless the message is received by another concurrent receive operation (that is executed by another thread at the probing process). Similarly, if a process busy waits with MPI_IPROBE and a matching message has been issued, then the call to MPI_IPROBE will eventually return flag = true unless the message is received by another concurrent receive operation.

注意finally的使用。如何进行进展是非常特定于实现的。将 5 次连续调用的以下输出与 MPI_Iprobe 进行比较(您的原始代码+一个紧密的循环):

打开 MPI 1.6.5 不带进度线程:

# Run 1
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 1
After MPI_Iprobe, flag = 1

# Run 2
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 1
After MPI_Iprobe, flag = 1
After MPI_Iprobe, flag = 1
After MPI_Iprobe, flag = 1

# Run 3
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 0

观察到同一 MPI 程序的多次执行之间没有一致性，并且在第 3 次运行中，标志仍然是 false 5 次调用 MPI_Iprobe 后.

英特尔 MPI 4.1.2:

# Run 1
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 1
After MPI_Iprobe, flag = 1
After MPI_Iprobe, flag = 1

# Run 2
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 1
After MPI_Iprobe, flag = 1
After MPI_Iprobe, flag = 1

# Run 3
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 0
After MPI_Iprobe, flag = 1
After MPI_Iprobe, flag = 1
After MPI_Iprobe, flag = 1

显然，英特尔 MPI 的进展与 Open MPI 不同。

两种实现之间的差异可以通过 MPI_Iprobe 来解释。应该是一个微小的探针，因此它应该花费尽可能少的时间。另一方面，进展需要时间，在单线程 MPI 实现中，唯一可能进展的时间点是对 MPI_Iprobe 的调用。 (在那种特殊情况下)。因此，MPI 实现者必须决定每次调用 MPI_Iprobe 实际进展了多少。并在通话完成的工作量和花费的时间之间取得平衡。

与 MPI_Probe事情是不同的。这是一个阻塞调用，因此它能够不断进行，直到出现匹配的消息(更具体地说是它的信封)。

关于mpi - 为什么当消息确定发送时 MPI_Iprobe 返回 false？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20999299/

文章推荐： d3.js - 复杂的 d3.nest() 操作

文章推荐：在 gnuplot 中的列上绘制具有条件的数据集

文章推荐： Spring Rest Controller 跟踪实体 View 计数

文章推荐： NetLogo 海龟留下的痕迹随着时间的推移而消失

iphone - 如果我向集合发送 -release 消息，它是否会向它所拥有的所有对象发送 -release 消息？
我一直在读到，如果一个集合“被释放”，它也会释放它的所有对象。另一方面，我还读到，一旦集合被释放，集合就会释放它的对象。但最后一件事可能并不总是发生，正如苹果所说。系统决定是否取消分配。在大多数情况
wcf - 以二进制方式序列化 WCF 消息，而不是作为 SOAP 消息
我有一个客户端-服务器应用程序，它使用 WCF 进行通信，并使用 NetDataContractSerializer 序列化对象图。由于服务器和客户端之间传输了大量数据，因此我尝试通过微调数据成员的
java - 针对特定属性组同步处理 jms 消息，但在其他组中同时处理 jms 消息
我需要有关 JMS 队列和消息处理的帮助。我有一个场景，需要针对特定属性组同步处理消息，但可以在不同属性组之间同时处理消息。我了解了特定于每个属性的消息组和队列的一些知识。我的想法是，我想针对
c++ - #define 打印(消息)std::cout << 消息 << std::endl
我最近开始使用 C++，并且有一种强烈的冲动 #define print(msg) std::cout void print(T const& msg) { std::cout void
java - JGroups:发送(空，空，消息)与发送(地址，空，消息)
我已经为使用 JGroups 编写了简单的测试。有两个像这样的简单应用程序 import org.jgroups.*; import org.jgroups.conf.ConfiguratorFact
javascript - 消息 : This browser doesn't support the API's required to use the firebase SDK.(消息/不支持的浏览器)
这个问题在这里已经有了答案: Firebase messaging is not supported in your browser how to solve this? (3 个回答) 7 个月前关
c# - EntityState 必须设置为 null、Created(对于 Create 消息)或 Changed(对于 Update 消息)
在我的 C# 控制台应用程序中，我正在尝试更新 CRM 2016 中的帐户。IsFaulted 不断返回 true。当我向下钻取时它返回的错误消息如下: EntityState must be set
json - Graylog 服务器无法通过 TCP::GELFDispatcher 读取 Gelf 消息 - 无法处理 GELF 消息::无法解压缩 GELF 消息负载
我正在尝试通过 tcp 将以下 json 写入 graylog 服务器: {"facility":"GELF","file":"","full_message":"Test Message Tcp",
Django 消息，如何隐藏特定消息
我正在使用 Django 的消息框架来指示成功的操作和失败的操作。如何排除帐户登录和注销消息？目前，登录后登陆页面显示已成功登录为“用户名”。我不希望显示此消息，但应显示所有其他成功消息。我的尝试
qt - 如何启用和禁用qDebug()消息
我通过编写禁用qDebug（）消息 CONFIG(release, debug|release):DEFINES += QT_NO_DEBUG_OUTPUT 在.pro文件中。这很好。我想知道是否可以
Laravel throttle 消息
我正在使用 ThrottleRequest 来限制登录尝试。在 Kendler.php 我有 'throttle' => \Illuminate\Routing\Middleware\Throttl
perl - 如何在没有位置信息的情况下输出die()消息？
我有一个脚本，它通过die引发异常。捕获异常时，我想输出不附加位置信息的消息。该脚本: #! /usr/bin/perl -w use strict; eval { die "My erro
rabbitmq - 消息、队列和交换器有哪些限制？
允许的消息类型有哪些(字符串、字节、整数等)？消息的最大大小是多少？队列和交换器的最大数量是多少？最佳答案理论上任何东西都可以作为消息存储/发送。实际上您不想在队列上存储任何内容。如果队列大部
.Net，向没有窗口的命令行进程发送按键/消息？
基本上，我正在尝试创建一个简单的 GUI 来与 Robocopy 一起使用。我正在使用进程打开 Robocopy 并将输出重定向到文本框，如下所示: With MyProcess.StartI
记录 MQ 消息
我想将进入 MQ 队列的消息记录到数据库/文件或其他日志队列，并且我无法修改现有代码。是否有任何方法可以实现某种类似于 HTTP 嗅探器的消息记录实用程序？或者也许 MQ 有一些内置的功能来记录消息？
未显示 primefaces 消息
我得到了一个带有 single_selection 数据表和一个命令按钮的页面。命令按钮调用一个 bean 方法来验证是否进行了选择。如果不是，它应该显示一条消息警告用户。如果进行了选择，它将导航到另
gcc 编译时间注释/消息
我知道 MSVC 可以通过 pragma 消息做到这一点 -> http://support.microsoft.com/kb/155196 gcc 是否有办法打印用户创建的警告或消息？ (我找不到谷
当有大量节点或二进制数据时 Erlang 消息
当存在大量节点或二进制数据时， native Erlang 消息能否提供合理的性能？情况 1:有一个大约 50-200 台机器的动态池(erlang 节点)。它在不断变化，每 10 分钟大约添加或删
登录后 django 消息
我想知道如何在用户登录后显示“欢迎用户，您已登录”的问候消息，并且该消息应在 5 秒内消失。该消息将在用户成功登录后显示一次，但在同一 session 期间连续访问主页时不会再次显示。因为我在 ho
居中添加名称的 sprintf 消息
如果我仅使用Welcome消息，我的代码可以正常工作，但是当打印p->client_name指针时，消息不居中。所以我的问题是如何将消息和客户端名称居中，就像它是一条消息一样。为什么它目前仅将消

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

mpi - 为什么当消息确定发送时 MPI_Iprobe 返回 false？