c - 如何让 MPI 中的所有等级向等级 0 发送一个值，然后阻塞接收所有等级？-6ren

c - 如何让 MPI 中的所有等级向等级 0 发送一个值，然后阻塞接收所有等级？

转载作者：太空宇宙更新时间：2023-11-04 03:23:20

25

4

假设我有 n 个进程:

他们进行计算，然后将结果发送到排名 0。这就是我想要发生的事情:

排名 0 将等待，直到它从所有排名中获得结果，然后将它们相加。

我该怎么做？另外，我想避免以下情况:

例如。 4 个进程 P0, P1, P2, P3,

P1 -> P0
P2 -> P0
P3 -> P0

与此同时，P1 完成了计算，因此 P1->P0 再次发生。

我希望 P0 在一个循环中只对 3 个进程进行加法，然后再为下一个循环进行加法。

有人可以建议使用 MPI 函数来执行此操作吗？我知道 MPI_Gather 但我不确定它是否阻塞

我想到了这个:

#include <mpi.h>
#include <stdio.h>

int main()
{
int pross, rank,p_count = 0;
int count = 10;
MPI_Init(&argc,&argv);
MPI_Comm_size(MPI_COMM_WORLD,&pross);
MPI_Comm_rank(MPI_COMM_WORLD,&rank);

int * num = malloc((pross-1)*sizeof(int));

        if(rank !=0)
        {
            MPI_Send(&count,1,MPI_INT,0,1,MPI_COMM_WORLD);
        }
        else
        {            
            MPI_Gather(&count, 1,MPI_INT,num, 1, MPI_INT, 0,MPI_COMM_WORLD);
            for(ii = 0; ii < pross-1;ii++ ){printf("\n NUM %d \n",num[ii]); p_count += num[ii]; }
}
MPI_Finalize();
}

我遇到错误:

  *** Process received signal ***
  Signal: Segmentation fault (11)
  Signal code: Address not mapped (1)
  Failing at address: (nil)
  [ 0] /lib/x86_64-linux-gnu/libpthread.so.0(+0x11630)[0x7fb3e3bc3630]
  [ 1] /lib/x86_64-linux-gnu/libc.so.6(+0x90925)[0x7fb3e387b925]
  [ 2] /usr/lib/libopen-pal.so.13(+0x30177)[0x7fb3e3302177]
  [ 3] /usr/lib/libmpi.so.12(ompi_datatype_sndrcv+0x54c)[0x7fb3e3e1e3ec]
  [ 4] /usr/lib/openmpi/lib/openmpi/mca_coll_tuned.so(ompi_coll_tuned_gather_intra_basic_linear+0x143)[0x7fb3d53d9063]
  [ 5] /usr/lib/libmpi.so.12(PMPI_Gather+0x1ba)[0x7fb3e3e29a3a]
  [ 6]  sosuks(+0xe83)[0x55ee72119e83]
  [ 7] /lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xf1)[0x7fb3e380b3f1]
  [ 8]  sosuks(+0xb5a)[0x55ee72119b5a]
  *** End of error message ***

另外，我试过:

#include <mpi.h>
#include <stdio.h>

int main()
{
int pross, rank,p_count = 0;
int count = 10;
MPI_Init(&argc,&argv);
MPI_Comm_size(MPI_COMM_WORLD,&pross);
MPI_Comm_rank(MPI_COMM_WORLD,&rank);

int * num = malloc((pross-1)*sizeof(int));

        if(rank !=0)
        {
            MPI_Send(&count,1,MPI_INT,0,1,MPI_COMM_WORLD);
        }
        else
        {            
            MPI_Gather(&count, 1,MPI_INT,num, 1, MPI_INT, 0,MPI_COMM_WORLD);
            for(ii = 0; ii < pross-1;ii++ ){printf("\n NUM %d \n",num[ii]); p_count += num[ii]; }
}
MPI_Finalize();
}

我在这里遇到错误:

  *** Process received signal ***
  Signal: Segmentation fault (11)
  Signal code: Address not mapped (1)
  Failing at address: 0x560600000002
  [ 0] /lib/x86_64-linux-gnu/libpthread.so.0(+0x11630)[0x7fefc8c11630]
  [ 1] mdscisuks(+0xeac)[0x5606c1263eac]
  [ 2] /lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xf1)[0x7fefc88593f1]
  [ 3] mdscisuks(+0xb4a)[0x5606c1263b4a]
  *** End of error message ***

对于第二次尝试，这里要注意的是发送和接收都成功了，但是出于某种原因，root 只能收到来自ranks 的2 条消息。看到的段错误是由于 num 中只有两个元素，我不明白为什么 num 只接收两次。

我调用代码为

mpiexec -n 6 ./sosuks

有人可以告诉我更好/正确的方法来实现我的想法吗？

更新:

除了下面的答案外，我还发现了上面我想分享的实现中的错误:

#include <mpi.h>
#include <stdio.h>

int main()
{
int pross, rank,p_count = 0;
int count = 10;
MPI_Init(&argc,&argv);
MPI_Comm_size(MPI_COMM_WORLD,&pross);
MPI_Comm_rank(MPI_COMM_WORLD,&rank);
MPI_Status status;
int * num = malloc((pross-1)*sizeof(int));

        if(rank !=0)
        {
            MPI_Send(&count,1,MPI_INT,0,1,MPI_COMM_WORLD);
        }
        else
        {
        int var,lick = 0;
        for(lick = 1; lick < pross; u++)
        {
        int fetihs;
        MPI_Recv(&fetihs,1,MPI_INT,lick,1,MPI_COMM_WORLD,&status);          

        var += fetihs;
        }
     // do things with var
}
MPI_Finalize();
}

最佳答案

在您的情况下，正如 Sneftel 指出的那样，您需要 MPI_Reduce。此外，您不需要在循环完成之前进行显式同步。

#include <mpi.h>
#include <stdio.h>
#include <stdlib.h>

int main(int argc, char* argv[])
{
    int pross, rank, p_count, count = 10;

    MPI_Init(&argc,&argv);
    MPI_Comm_size(MPI_COMM_WORLD, &pross);
    MPI_Comm_rank(MPI_COMM_WORLD, &rank);

    int* num = malloc((pross-1)*sizeof(int));

    // master does not send data to itself.
    // only workers send data to master.

    for (int i=0; i<3; ++i)
    {
        // to prove that no further sync is needed.
        // you will get the same answer in each cycle.
        p_count = 0; 

        if (rank == 0)
        {
            // this has not effect since master uses p_count for both 
            // send and receive buffers due to MPI_IN_PLACE.
            count = 500;

            MPI_Reduce(MPI_IN_PLACE, &p_count, 1, MPI_INT, MPI_SUM, 0, MPI_COMM_WORLD);
        }
        else
        {
            // for slave p_count is irrelevant.
            MPI_Reduce(&count, NULL, 1, MPI_INT, MPI_SUM, 0, MPI_COMM_WORLD);
        }

        if (rank == 0)
        {
            printf("p_count = %i\n", p_count);
        }

        // slaves send their data to master before the cycle completes.
        // no need for explicit sync such as MPI_Barrier.
        // MPI_Barrier(MPI_COMM_WORLD); // no need.
    }

    MPI_Finalize();
}

在上面的代码中，slave 中的 count 减少为 master 中的 p_count。请注意 MPI_IN_PLACE 和两个 MPI_Reduce 调用。您可以通过简单地设置 count = 0 并在没有 MPI_IN_PLACE 的情况下按所有等级调用 MPI_Reduce 来获得相同的功能。

for (int i=0; i<3; ++i)
{
    p_count = 0;    
    if (rank == 0) count = 0;

    MPI_Reduce(&count, &p_count, 1, MPI_INT, MPI_SUM, 0, MPI_COMM_WORLD);           
}

关于c - 如何让 MPI 中的所有等级向等级 0 发送一个值，然后阻塞接收所有等级？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43413433/

25

4

0

文章推荐： node.js - 使用 Nodejs 和 HTML 正文发送邮件

文章推荐： c++ - 如何将 char 数组中的值与另一个 char 进行比较

excel - 函数中不连续的单元格列表(等级)
这可能是一个简单的“不可能”的答案，但我想确定一下。我目前正在使用 LibreOffice，但如果可以在 Excel 中使用，我可以切换。我有一个包含几个表格的电子表格，每个表格都有不同数据的相同测
groovy - 如何通过groovy从cmd写入日志文件？ (等级)
我有一个应用程序，并且在主gradle文件中编写: task myTask { def command = "wsimport -s src" + File.separator + "main
c++ - 如何在RANSAC平面估算器上包含自定义约束/等级？
我正在尝试使用点云库从点云中分割一个平面，并且我有一些有关平面模型的先验信息(即法线应该类似于z轴，高度(d)应该大约为0) 。有没有办法强制我的RANSAC算法选择与我先前模型相似的系数？我认为可
excel - 在动态范围上查找 Alpha 等级
我正在为一个发票项目开发一个基于 excel 的设备数据库。每个独特的项目都有自己的工作簿，但我正在尝试构建一个模板工作簿来限制每个项目的发票中有多少手动工作。每件设备都有一个型号、序列号和允许的地址
iphone - 收到内存警告。等级=1
嗨， friend 们，我正在开发位置查找应用程序，每次我进入 map 页面时，我都会收到如下警告: "Received memory warning. Level=1" 应用程序崩溃后，我不知道该怎
firebase - Flutter:向用户显示总分/等级
我在状态中设置了 score、topicTotal 和 level，我正在打印它们中的每一个。 topicTotal 是所有分数相加的最终分数，level 基于它们的 topicTotal。 scor
javascript - 如何改变 body 等级
这个问题在这里已经有了答案: How can I change an element's class with JavaScript? (33 个答案) 关闭 4 年前。
javascript - 根据条件延长 Ember 等级
是否可以根据条件扩展 Ember 类？像这样的事情: A.reopen({ if (condition) { init: function() { this.super();
python - Pandas 变换组中的位置/等级
我有以下 DataFrame，其中包含两组动物以及它们每天吃多少食物， df = pd.DataFrame({'animals': ['cat', 'cat', 'dog', 'dog', 'rat'
c++ - 等级 2 导致所有机架集体中止
下面的代码尝试使用 mpi 查找数组的最大数量.但是我不断收到以下错误: Rank 2 in job 47 caused collective abort of all ranks. Exit sta
python - 等级> 2的Tensorflow matmul操作不起作用
我在 Tensorflow 文档主页上找到以下关于在等级>2 时使用 matmul 操作的内容: https://www.tensorflow.org/api_docs/python/math_ops
android - Android库-为什么不下载我的依赖项？ (等级/Maven)
我试图弄清楚如何将Android Library项目分发给某些Beta用户，但是在分发并将其用于示例项目时遇到了一些问题。我正在尝试分发AAR文件。我的示例项目中的所有内容都可以正常编译，但出现错误
java - 等级: "Could not determine which tasks to execute."
我收到了以下 gradle 构建文件 (gae.gradle)，其中包含来自 SpringSource 的示例项目，但是当我尝试使用 gradle 运行它时: gradle gae 它生成错误: FA
php - Eloquent/SQL - 获取查询的行号(等级)
我想知道基于我的数据库结构的排名: 我有一个模型 Post 属于一个名为 Edition 的模型(也是 one Edition 有很多 Post). 一个Post有很多Like。我想根据特定 Edi
javascript - 如何设置 Angular body 等级？
我试图在登录页面中向正文添加一个类“bodyLogin”，并在所有其他页面中将其删除。angular的方式应该怎么做？最佳答案正如 Jeremy 所建议的那样，我使用了 ng 类，但在自动设置 $
PHP Facemash ELO 等级/功能
我从 PHPClasses 网站获得了以下 ELO 类。 $S2) { $E = 120 - round(1 / (1 + pow(10, (($R2 - $R1)
python - Numpy 等级 1 数组
我是 Matlab/Octave 用户。 Numpy 文档说 array 比 matrix 更可取。有没有一种方便的方法来处理 rank-1 数组，而不需要不断地 reshape 它？例子: dat
mpi - 如何确定套接字/节点本地的 MPI 等级/进程号
比如说，我使用 MPI 运行一个并行程序。执行命令 mpirun -n 8 -npernode 2 总共启动8个进程。即每个节点有 2 个进程，总共有 4 个节点。 (OpenMPI 1.5)。其中
sql - 在不使用 ROW_NUMBER() OVER 函数的情况下获取分区内行(等级)的序列号
我需要按分区(或组)对行进行排名，即如果我的源表是: NAME PRICE ---- ----- AAA 1.59 AAA 2.00 AAA 0.75 BBB 3.48 BBB 2.19 B
android-studio - 如何在Android Studio中使用CMake -C选项(等级)？
我必须从文件中填充 CMake 变量缓存。我在defaultConfig.externalNativeBuild.cmake.arguments(-C options.cmake)中添加了一个参数。

首页

博学

6Ren·AI

商城

c - 如何让 MPI 中的所有等级向等级 0 发送一个值，然后阻塞接收所有等级？