c++ - MPI2/MPI3 : MPI_allgather vs MPI one sided communication considering synchronization-6ren

c++ - MPI2/MPI3 : MPI_allgather vs MPI one sided communication considering synchronization

转载作者：太空宇宙更新时间：2023-11-04 13:48:23

我正在使用 MPI-2 编写一个优化程序，其中我需要一个等长的 std::vector 的 std::vector(概念上) ，在所有进程之间共享。此 vector 包含针对当前发现的问题的最佳 k 解决方案，并在每次许多 MPI 进程之一找到新的最佳解决方案时更新。每个过程寻找新解决方案所花费的时间通常相差很大。

我的问题是，考虑到同步和等待中的性能问题，我是否应该在每次找到新的最佳解决方案时使用 MPI 集合，例如 MPI_allgather；或者我应该使用 MPI-2 中的单向通信来维护所有进程之间的“共享” vector 。

特别是，如果我使用 MPI_allgather，进程是否会提前空闲并等待与其他进程的某种同步？

我有一些 MPI 点对点通信(更新:以及 UPC)的工作经验，但在实际编码中没有使用过集体或单向通信。我搜索了 SO 并找到了有关 MPI_allgathers 的相关问题/答案，例如Distribute a structure using MPI_Allgather , 以及关于单向通信 Creating a counter that stays synchronized across MPI processes .但是我很难说出这两种方法之间的确切区别。

谢谢，

---更新---

特别是，我在底部有来自 Creating a counter that stays synchronized across MPI processes 的代码示例，它使用单面维护单个 int“共享”。我试图使它适应泛型类型，但不知道如何让它工作，因为我无法理解原始代码以及为什么它维护一个数组 data，以及我如何概括MPI_Accumulate 到用户函数(比如简单地用新 vector 替换旧 vector )。

template//注意:T 只能是原始类型(不能是指针、ref 或 struct)，例如 int 和 double。结构 mpi_array { typedef std::vector vector ； MPI_双赢； int hostrank;
内部等级；
整数大小；
vector 值；
vector *hostvals；};

单边通信计数器代码:

#include <mpi.h>
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>

struct mpi_counter_t {
    MPI_Win win;
    int  hostrank ;
    int  myval;
    int *data;
    int rank, size;
};

struct mpi_counter_t *create_counter(int hostrank) {
    struct mpi_counter_t *count;

    count = (struct mpi_counter_t *)malloc(sizeof(struct mpi_counter_t));
    count->hostrank = hostrank;
    MPI_Comm_rank(MPI_COMM_WORLD, &(count->rank));
    MPI_Comm_size(MPI_COMM_WORLD, &(count->size));

    if (count->rank == hostrank) {
        MPI_Alloc_mem(count->size * sizeof(int), MPI_INFO_NULL, &(count->data));
        for (int i=0; i<count->size; i++) count->data[i] = 0;
        MPI_Win_create(count->data, count->size * sizeof(int), sizeof(int),
                       MPI_INFO_NULL, MPI_COMM_WORLD, &(count->win));
    } else {
        count->data = NULL;
        MPI_Win_create(count->data, 0, 1,
                       MPI_INFO_NULL, MPI_COMM_WORLD, &(count->win));
    }
    count -> myval = 0;

    return count;
}

int increment_counter(struct mpi_counter_t *count, int increment) {
    int *vals = (int *)malloc( count->size * sizeof(int) );
    int val;

    MPI_Win_lock(MPI_LOCK_EXCLUSIVE, count->hostrank, 0, count->win);

    for (int i=0; i<count->size; i++) {

        if (i == count->rank) {
            MPI_Accumulate(&increment, 1, MPI_INT, 0, i, 1, MPI_INT, MPI_SUM,
                           count->win);
        } else {
            MPI_Get(&vals[i], 1, MPI_INT, 0, i, 1, MPI_INT, count->win);
        }
    }

    MPI_Win_unlock(0, count->win);
    count->myval += increment;

    vals[count->rank] = count->myval;
    val = 0;
    for (int i=0; i<count->size; i++)
        val += vals[i];

    free(vals);
    return val;
}

void delete_counter(struct mpi_counter_t **count) {
    if ((*count)->rank == (*count)->hostrank) {
        MPI_Free_mem((*count)->data);
    }
    MPI_Win_free(&((*count)->win));
    free((*count));
    *count = NULL;

    return;
}

void print_counter(struct mpi_counter_t *count) {
    if (count->rank == count->hostrank) {
        for (int i=0; i<count->size; i++) {
            printf("%2d ", count->data[i]);
        }
        puts("");
    }
}

int test1() {
    struct mpi_counter_t *c;
    int rank;
    int result;

    c = create_counter(0);

    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    result = increment_counter(c, 1);
    printf("%d got counter %d\n", rank, result);

    MPI_Barrier(MPI_COMM_WORLD);
    print_counter(c);
    delete_counter(&c);
}


int test2() {
    const int WORKITEMS=50;

    struct mpi_counter_t *c;
    int rank;
    int result = 0;

    c = create_counter(0);

    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    srandom(rank);

    while (result < WORKITEMS) {
        result = increment_counter(c, 1);
        if (result <= WORKITEMS) {
             printf("%d working on item %d...\n", rank, result);
             sleep(random() % 10);
         } else {
             printf("%d done\n", rank);
         }
    }

    MPI_Barrier(MPI_COMM_WORLD);
    print_counter(c);
    delete_counter(&c);
}

int main(int argc, char **argv) {

    MPI_Init(&argc, &argv);

    test1();
    test2();

    MPI_Finalize();
}

最佳答案

您担心某些进程可能会先于其他进程进入 MPI_ALLGATHER 是有效的，但在任何具有同步的应用程序中总是如此，而不仅仅是那些明确使用集体通信的应用程序。

但是，您似乎对单边操作的作用有误解。他们不提供并行全局地址空间 (PGAS) 模型，其中所有内容都为您同步。相反，它们只是为您提供了一种直接寻址远程进程内存的方法。每个进程的内存仍然是独立的。此外，如果您要从一个点到另一个点升级到 MPI 的其余部分，我不会将您自己限制在 MPI-2 函数上。 MPI-3 中有一些新内容也改善了集体和单方面(尤其是后者)。

综上所述，如果您除了点对点之外从未使用过任何东西，那么单面对您来说将是一个巨大的飞跃。无论如何，您可能想要进行更多的中间步骤并首先检查 collectives。如果你对自己的表现还是不满意，你可以看一下片面的章节，但它非常复杂，大多数人通常最终会使用一些位于片面之上的东西而不是直接使用它(比如一些 PGAS 语言)。

关于c++ - MPI2/MPI3 : MPI_allgather vs MPI one sided communication considering synchronization，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24700168/

文章推荐： c++ - 模板化类中模板化成员函数的特化

文章推荐： java - 我可以从递归返回到 main 而不展开堆栈吗？

文章推荐： html - 为什么我的页面不居中？

office-communicator - Office Communicator 在线状态如何工作？
我有兴趣了解有关 Microsoft Office Communicator 的更多信息IM 客户端，以及它如何确定您的存在(即您是在计算机旁还是不在)。任何人都可以向我指出解释这一点的教程或 API
python - .communicate() 和 .communicate()[0] 有什么区别？
我正在使用 python。我正在尝试运行一个进程并使用 subprocess.popen 获取输出。阅读周围后，我看到人们使用 communicate()[0] 但那不在文档中，它用于示例。我想知道是
python - .communicate() 和 .communicate()[0] 有什么区别？
我正在使用 python。我正在尝试运行一个进程并使用 subprocess.popen 获取输出。阅读周围后，我看到人们使用 communicate()[0] 但那不在文档中，它用于示例。我想知道是
Azure 计算模拟器错误 "The communication object ... cannot be used for communication because it is in the Faulted state."
我有一些设置和拆卸脚本，它们使用 csrun.exe 为一些自动化测试准备本地计算模拟器。 C:\Program Files\Microsoft SDKs\Azure\Emulator\csrun.e
go - 解释: Don't communicate by sharing memory; share memory by communicating
我想知道对这句名言最接地气的解释是什么: Don't communicate by sharing memory; share memory by communicating. (R. Pike) 在
communication - 无状态协议(protocol)的参数(上下文 : simple point-to-point communication)
(所以 this question has been asked before ，但在一般意义上，大多数响应都是在与多个服务器/客户端/等的一般网络通信的上下文中) 在简单的点对点通信协议(proto
python - boost.mpi.world Communicator 与 C++ 签名不匹配:boost::mpi::communicator
我正在尽力将 C++ 模块链接到 python 绑定(bind)。我正在努力实现 boost mpi 通信。我正在将 boost.mpi.world 对象发送到 C++，它需要一个 boost::mp
python - 为什么 `print foo.communicate()[0]` 与 `print foo.communicate()` 不同“
情况是这样的: 我有一个正在运行的命令: import subprocess foo = subprocess.Popen('ls /', shell=True, stdout=subprocess.
communication - 你为提高软技能所做的最有效的事情是什么？
关闭。这个问题是opinion-based .它目前不接受答案。想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题. 7年前关闭。 Improve t
communication - 你如何与你所在城市以外的团队沟通？
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题？ Update the question所以它是on-topic对于堆栈溢出。 10年前关闭。 Improve this qu
communication - 如何让员工更多地参与？
关闭。这个问题是opinion-based .它目前不接受答案。想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题. 2年前关闭。 Improve t
communication - 如何与客户进行良好的沟通
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 5 年前。 Improve
communication - 您是否出于工作目的在线聊天？
我曾与那些与同龄人在线聊天的人一起工作，他们不断地围绕想法进行讨论。我也曾与那些坚决拒绝并认为这是浪费时间的人一起工作。在线实时聊天论坛对您特别有用吗？为什么或者为什么不？在您的公司内部，还是在外
communication - 保持应用程序和基础设施连接
我在一个分为两组的 IT 部门工作。一组开发和管理应用程序，另一组管理公司的基础设施和服务器。我们面临的问题之一是沟通中断。我为应用程序组工作，我遇到的问题之一是当基础设施关闭服务器或刷新数据库时没有
communication - 优先考虑开发人员通信的即时消息
我的团队与 IM 进行了很多交流。我们有时甚至会使用 IM 向在下一个立方体中的人提问。这样做的原因是我们都发现接听 IM 的干扰比说话要少得多。尽管如此，我发现当我低头编码时，闪烁的消息窗口可能会
communication - 管理数字干扰的有效方法
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
communication - 改善软件团队成员之间沟通的方法
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 4年前关闭。 Improve thi
communication - 密集的编程会降低沟通技巧？
关闭。这个问题是opinion-based .它目前不接受答案。想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题. 3年前关闭。 Improve t
communication - 客户参与敏捷开发的最佳实践？
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题？ Update the question所以它是on-topic对于堆栈溢出。 10年前关闭。 Improve this qu
communication - 汉明码是如何工作的？
传输数据时，汉明码显然允许您重新创建已通过线路损坏的数据(纠错码)。这是如何工作的，它的局限性是什么(如果有的话)？有没有更好的纠错解决方案(相对于重传)？是否存在重传更好的情况？最佳答案让我

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - MPI2/MPI3 : MPI_allgather vs MPI one sided communication considering synchronization