c - MPI_Gather() 将中心元素收集到一个全局矩阵中-6ren

c - MPI_Gather() 将中心元素收集到一个全局矩阵中

转载作者：太空宇宙更新时间：2023-11-03 23:22:53

24

4

这是来自 MPI_Gather 2D array 的后续问题.这是情况:

id = 0 has this submatrix

|16.000000| |11.000000| |12.000000| |15.000000|
|6.000000| |1.000000| |2.000000| |5.000000|
|8.000000| |3.000000| |4.000000| |7.000000|
|14.000000| |9.000000| |10.000000| |13.000000|
-----------------------

id = 1 has this submatrix

|12.000000| |15.000000| |16.000000| |11.000000|
|2.000000| |5.000000| |6.000000| |1.000000|
|4.000000| |7.000000| |8.000000| |3.000000|
|10.000000| |13.000000| |14.000000| |9.000000|
-----------------------

id = 2 has this submatrix

|8.000000| |3.000000| |4.000000| |7.000000|
|14.000000| |9.000000| |10.000000| |13.000000|
|16.000000| |11.000000| |12.000000| |15.000000|
|6.000000| |1.000000| |2.000000| |5.000000|
-----------------------

id = 3 has this submatrix

|4.000000| |7.000000| |8.000000| |3.000000|
|10.000000| |13.000000| |14.000000| |9.000000|
|12.000000| |15.000000| |16.000000| |11.000000|
|2.000000| |5.000000| |6.000000| |1.000000|
-----------------------

The global matrix:

|1.000000| |2.000000| |5.000000| |6.000000|
|3.000000| |4.000000| |7.000000| |8.000000|
|11.000000| |12.000000| |15.000000| |16.000000|
|-3.000000| |-3.000000| |-3.000000| |-3.000000|

我想做的是仅收集全局网格中的中心元素(不在边界中的元素)，因此全局网格应该是这样的:

 |1.000000| |2.000000| |5.000000| |6.000000|
 |3.000000| |4.000000| |7.000000| |8.000000|
 |9.000000| |10.000000| |13.000000| |14.000000|
 |11.000000| |12.000000| |15.000000| |16.000000|

和我得到的不一样。这是我的代码:

float **gridPtr;
float **global_grid;
lengthSubN = N/pSqrt; // N is the dim of global gird and pSqrt the sqrt of the number of processes
MPI_Type_contiguous(lengthSubN, MPI_FLOAT, &rowType);
MPI_Type_commit(&rowType);
if(id == 0) {
    MPI_Gather(&gridPtr[1][1], 1, rowType, global_grid[0], 1, rowType, 0, MPI_COMM_WORLD);
    MPI_Gather(&gridPtr[2][1], 1, rowType, global_grid[1], 1, rowType, 0, MPI_COMM_WORLD);
} else {
    MPI_Gather(&gridPtr[1][1], 1, rowType, NULL, 0, rowType, 0, MPI_COMM_WORLD);
    MPI_Gather(&gridPtr[2][1], 1, rowType, NULL, 0, rowType, 0, MPI_COMM_WORLD);
}
...
float** allocate2D(float** A, const int N, const int M) {
    int i;
    float *t0;

    A = malloc(M * sizeof (float*)); /* Allocating pointers */
    if(A == NULL)
        printf("MALLOC FAILED in A\n");
    t0 = malloc(N * M * sizeof (float)); /* Allocating data */
    if(t0 == NULL)
        printf("MALLOC FAILED in t0\n");
    for (i = 0; i < M; i++)
        A[i] = t0 + i * (N);

    return A;
}

编辑:

这是我在没有 MPI_Gather() 但有子数组的情况下的尝试:

    MPI_Datatype mysubarray;

    int starts[2] = {1, 1};
    int subsizes[2]  = {lengthSubN, lengthSubN};
    int bigsizes[2]  = {N_glob, M_glob};
    MPI_Type_create_subarray(2, bigsizes, subsizes, starts,
                             MPI_ORDER_C, MPI_FLOAT, &mysubarray);
    MPI_Type_commit(&mysubarray);
    MPI_Isend(&(gridPtr[0][0]), 1, mysubarray, 0, 3, MPI_COMM_WORLD, &req[0]);
    MPI_Type_free(&mysubarray);
    MPI_Barrier(MPI_COMM_WORLD);
    if(id == 0) {
      for(i = 0; i < p; ++i) {
        MPI_Irecv(&(global_grid[i][0]), lengthSubN * lengthSubN, MPI_FLOAT, i, 3, MPI_COMM_WORLD, &req[0]);
      }
    }
    if(id == 0)
            print(global_grid, N_glob, N_glob);

但结果是:

|1.000000| |2.000000| |3.000000| |4.000000|
|5.000000| |6.000000| |7.000000| |8.000000|
|9.000000| |10.000000| |11.000000| |12.000000|
|13.000000| |14.000000| |15.000000| |16.000000|

这不是我想要的。我必须找到一种方法来告诉 recv 它应该以另一种方式放置数据。所以，如果我这样做:

MPI_Irecv(&(global_grid[0][0]), 1, mysubarray, 0, 3, MPI_COMM_WORLD, &req[0]);

然后我会得到:

|-3.000000| |-3.000000| |-3.000000| |-3.000000|
|-3.000000| |1.000000| |2.000000| |-3.000000|
|-3.000000| |3.000000| |4.000000| |-3.000000|
|-3.000000| |-3.000000| |-3.000000| |-3.000000|

最佳答案

我无法提供完整的解决方案，但我会解释为什么您使用 MPI_Gather 的原始示例无法按预期工作。

使用 lengthSubN=2，您定义了一个新的 2 个 float 数据类型，它们存储在内存中相邻的这一行:

MPI_Type_contiguous(lengthSubN, MPI_FLOAT, &rowType);

现在，让我们看一下第一个 MPI_Gather 调用:

if(id == 0) {
    MPI_Gather(&gridPtr[1][1], 1, rowType, global_grid[0], 1, rowType, 0, MPI_COMM_WORLD);
} else {
    MPI_Gather(&gridPtr[1][1], 1, rowType, NULL, 0, rowType, 0, MPI_COMM_WORLD);
}

它需要 1 个 rowType，这是 2 个相邻的 float ，从每个等级的元素 gridPtr[1][1] 开始。这些是值:

id 0:  1.0   2.0
id 1:  5.0   6.0
id 2:  9.0  10.0
id 3: 13.0  14.0

并将它们相邻放置在 global_grid[0] 指向的接收缓冲区中。这个指针实际上指向了第一行的开始，所以内存中充满了:

 1.0   2.0   5.0   6.0   9.0  10.0  13.0  14.0

但是，global_grid 每行只有 4 列，因此最后 4 个值换行到 global_grid[1] (*) 指向的第二行。这甚至可能是未定义的行为。因此，在 MPI_Gather 之后，global_grid 的内容是:

 1.0   2.0   5.0   6.0 
 9.0  10.0  13.0  14.0
-3.0  -3.0  -3.0  -3.0
-3.0  -3.0  -3.0  -3.0

第二个 MPI_Gather 的工作方式相同，从 global_grid 的第二行开始写入:

 3.0   4.0   7.0   8.0  11.0  12.0  15.0  16.0

因此它覆盖了上面的一些值，结果如观察到的那样:

 1.0   2.0   5.0   6.0 
 3.0   4.0   7.0   8.0
11.0  12.0  15.0  16.0
-3.0  -3.0  -3.0  -3.0

(*) allocate2d 实际上是为二维数据缓冲区分配连续内存。

关于c - MPI_Gather() 将中心元素收集到一个全局矩阵中，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34545278/

24

4

0

文章推荐： c# - BindingExpression 路径错误 : property not found

文章推荐： python - 在 Python 中序列化 C 结构并通过套接字发送

文章推荐： c - 有符号与无符号比较

文章推荐： html - Bootstrap 3.3 在模态上显示双滚动条

mpi - MPI_Gather 函数的困难
我在每个处理器(假设 3 个处理器)的本地数组(名为 lvotes)上都有一个值，每个处理器的第一个元素都存储一个值，即: P0 : 4 P1 : 6 p2 : 7 现在，使用 MPI_Gather，
c - MPI_Gather 金额不等？
我正在使用 MPI_Scatter 和 MPI_Gather 实现矩阵乘法。如果进程数平均分为矩阵行数和列数，我的代码就可以正常工作。但是，当它们不均匀划分时，它会在 MPI_Gather 上崩溃。这
c - MPI_Gather 发送和接收数组错误
#include #include int main(int argc,char * argv[]) { int rank,size,m; int ar
c++ - MPI_Gather 的段错误
我是第一次使用 MPI_Gather 并遵循了一些示例，但出于某种原因，我每次调用它时都会遇到段错误。相关代码在这里: //Get the top N matches for each nod
c - 如何干预 MPI_Gather
我有两个 MPI 进程。每个进程都有一个相同大小的数组。我想将两个数组合并为一个双倍大小的数组。我应该使用哪个 mpi 接口(interface)？例如，我有两个数组: 我想让他们进入排名 0: 我
c - MPI_Gather 似乎不起作用
我需要在我的矩阵乘法程序中使用 MPI_Gather 函数，但最近几天遇到了问题。因此，我单独使用 gather 函数编写了一个简单的 MPI 程序，并一直试图让它运行……为此，我引用了“Peter
c - MPI_Gather 二维数组
N 是 4，N_glob 也是。它恰好大小相同。 p 为 4。下面是一小部分代码: float **global_grid; float **gridPtr; lengthSubN = N/pSqr
c - MPI_Gather 段错误
我有这个并行高斯消除代码。调用 MPI_Gather 函数调用时会发生段错误。我知道如果没有为两个缓冲区正确分配内存，这样的错误可能会增加。但是我看不出内存管理代码有什么问题。有人可以帮忙吗？谢谢
c - MPI_Gather() 将中心元素收集到一个全局矩阵中
这是来自 MPI_Gather 2D array 的后续问题.这是情况: id = 0 has this submatrix |16.000000| |11.000000| |12.000000| |
c - 使用 MPI_Gather 接收数据结构的正确方法
我尝试使用 MPI_Gather 发送以下数据结构: struct set { int nbits; char bits[]; }; 问题是我无法收集上述结构的所有项目，只能收集第一
c - MPI_Gather C 中的结构数组
我正在尝试使用 MPI_Gather 收集结构数组。我使用 MPI_Type_contigulous 创建了一个结构“Final”的派生数据类型“mystruct”(每个元素都是 double )。然
MPI_Gather 可以用于从使用 MPI_Send 的线程接收数据吗？
我有一个主进程和更多从进程。我希望每个从进程向主进程发送一个整数，所以我想我应该使用 MPI_Gather 收集它们。但不知怎的，它不起作用，我开始认为 MPI_Gather 与 MPI_Send 不
c - 使用 MPI_Gather 断言失败
我正在尝试编写 MPI C 代码，该代码重复执行计算并将其结果保存到单个数组中，以降低输出频率。下面的示例代码(var 的大小，200，足以满足正在使用的 CPU 数量): #include #in
c - 如何使用 MPI_Gather 函数从变量中获取数据
我尝试编写“查找素数”代码。但是 MPI_Gather 函数无法获取“c”的值(素数)。即使我声明其他数组也不起作用。我的代码源有什么问题？当我删除 MPI_Gather 函数的部分时，效果很好。我是
c - 为什么 MPI_Gather 会出现缓冲区错误？
所以我想做的是将输入字符串“HELO”打印为“HEELLLOOOO”到目前为止，我已经想出了这段代码 #include #include #include int main(int argc,
c - 使用 MPI_Gather 将所有进程计算出的总和收集到一个数组中
我试图让每个进程计算总和，然后将总和发送回根进程。但是， printf("\nSUMS[%d] = %d",i,sums[i]); 行打印出的总和与 printf("中打印的总和不同\n我是进程 %
c - MPI_Gather C 中的内存寻址
我正在尝试将数据传递给MPI_Gather。我按如下方式分配内存: float *phie, *phitemp; MPI_Comm_size(MPI_COMM_WORLD, &size); MPI_C
c++ - OpenMPI MPI_Gather 段错误或断言错误
我正在尝试使用 OpenMPI 为我的本科高级项目构建一个多进程光线追踪器，以便我可以在我学校的 super 计算机上运行它。我已经到了代码可以正常编译和运行的地步，直到我到达该行 MPI_Gath
c - 二维数组的 MPI_Gather 段错误
我在 C 语言的 MPI 代码中遇到问题。我想我创建了一个很好的算法来处理二维数组的双循环。但是，当我尝试使用 MPI_Gather 从进程中收集数据时，出现段错误。这是代码: #define NN
c++ - MPI_Gather()、MPI_Scatter()中发送计数和接收计数有什么区别？
在 MPI 聚集和分散中，发送和接收有两个计数。我检查了文档，发现两者应该具有相同的值。 Ex:- 在 MPI_Gather() 中，send_count 和 receive_count 的大小都应该

首页

博学

6Ren·AI

商城

c - MPI_Gather() 将中心元素收集到一个全局矩阵中