c - MPI 分散/收集变量范围-6ren

c - MPI 分散/收集变量范围

转载作者：太空宇宙更新时间：2023-11-04 08:01:55

25

4

我正在处理 BML 自动机的 MPI 版本，但 MPI_Scatter() 不会像我预期的那样工作。我读了here对于集体通信功能，每个进程都需要它的数组副本，只是没有初始化的分配空间。在我的代码中，有一个每个进程都操作的子网格 local_grid，以及一个只有 root 操作的起始大 grid。我的意思是使用 MPI 数据类型的 Scatter-Gather 通信。我为每个网格和子网格分配空间，然后只为根初始化网格。我哪里错了？

        unsigned char*** local_grid;
        unsigned char** grid;

        MPI_Status stat;
        MPI_Datatype rowtype;

        MPI_Init(&argc, &argv);
        MPI_Comm_rank(MPI_COMM_WORLD, &rank);
        MPI_Comm_size(MPI_COMM_WORLD, &nproc);
        local_n = N / nproc;

        MPI_Type_contiguous(N + 2,    /* count */
                MPI_UNSIGNED_CHAR,    /* oldtype */
                &rowtype              /* newtype */
                );
        MPI_Type_commit(&rowtype);

        /* Allocate space for 3D local grids*/
        local_grid = (unsigned char***)malloc(2 * sizeof(unsigned char**));
        for(i = 0; i < 2; i++) {
            local_grid[i] = (unsigned char**)malloc((local_n + 2) * sizeof(unsigned char*));
            for(j = 0; j < local_n + 2; j++) {
                local_grid[i][j] = (unsigned char*)malloc((N + 2) * sizeof(unsigned char));
            }
        }
        /* Initialize local grids*/
        for(i = 0; i < local_n + 2; i++) {
            for(j = 0; j < N + 2; j++) {
                local_grid[0][i][j] = 0;
                local_grid[1][i][j] = 0;
            }
        }
        /* Allocate 2D starting grid */
        grid = (unsigned char**)malloc(N * sizeof(unsigned char*));
        for(i = 0; i < N + 2; i++) {
            grid[i] = (unsigned char*)malloc((N + 2) * sizeof(unsigned char));
        }
        /* Root */
        if(rank == 0) {
            /* initialize 2D starting grid */
            for(i = 0; i < N; i++) {
                for(j = 0; j < N + 2; j++) {
                    grid[i][j] = (((float)rand())/RAND_MAX) > rho ? 0 : rand()%2 + 1;
                    grid[i][0] = grid[i][N+1] = 0;
                    printf("%2d ", grid[i][j]);
                }
                printf("\n");
            }
        }
        /* All */
        MPI_Scatter(grid[0], local_n, rowtype, local_grid[cur][1], local_n, rowtype, source, MPI_COMM_WORLD);

        ...

程序正确终止，但只有一个 rowtype 行从 Scatter() 传递到根进程，无论其编号如何，都不会传递给任何其他进程。

最佳答案

问题来自您声明/分配二维数组的方式。

您将二维数组声明为数组指针数组(例如矩阵行)，但 MPI 需要连续布局。

例如，你可以替换

grid = (unsigned char**)malloc(N * sizeof(unsigned char*));
for(i = 0; i < N; i++) {
    grid[i] = (unsigned char*)malloc((N + 2) * sizeof(unsigned char));
}

与

    grid = (unsigned char**)malloc(N * sizeof(unsigned char*));
    grid[0] = (unsigned char*)malloc(N*(N+2)*sizeof(unsigned char));
    for(i = 1; i < N; i++) {
        grid[i] = grid[i-1] + N + 2;
    }

然后使用 grid[0] 作为 MPI_Scatter() 或 MPI_Gather() 的缓冲区参数同样的事情必须应用于 local_grid[0] 和 local_grid[1]

当你需要释放网格时，你可以简单地

free(grid[0]);
free(grid);

请注意，如果 N 不是 nproc 的倍数，我认为您的程序无法正常运行

关于c - MPI 分散/收集变量范围，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45903662/

25

4

0

文章推荐： javascript - 粘性导航栏在移动设备上存在错误

文章推荐： python - 将字符串与字符列表进行比较

文章推荐： java - Java Struts 中 HTML 下拉菜单的动态数量

文章推荐： html - 如何使用 Bootstrap 4 使 Div 与屏幕大小相同

python - 分散 DataFrame 的快速插值
TL;DR:问题:是否有一种快速方法可以在特定坐标处插入分散的二维数据集？如果是的话，有人可以提供一个示例，其中包含“当前解决方案”中使用的示例数据和变量(因为我自己实现它显然很愚蠢)。问题:
c - MPI 分散/发送数据到进程
我正在使用 n = 2 运行我的代码。我一直在尝试研究，但我不明白为什么当我尝试多次运行我的代码时会获得不同的输出。在下面，您可以看到当我使用 n = 2 运行时的输出，并且我的 txt.file
c - MPI 分散/收集变量范围
我正在处理 BML 自动机的 MPI 版本，但 MPI_Scatter() 不会像我预期的那样工作。我读了here对于集体通信功能，每个进程都需要它的数组副本，只是没有初始化的分配空间。在我的代码中，
machine-learning - 如何针对噪声(分散)数据选择回归算法？
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 6 年前。 Improve
java - 用于字符串处理的 Akka 分散-聚集
我需要将输入字符串拆分为输出字符串(按一定顺序)通过在输入字符串上应用一组正则表达式。我想实现这个功能与 akka Actor 集群一起使用，我将其分散正则表达式和输入字符串并收集字符串。不过我想知道
python - MPI4Py 分散 sendbuf 参数类型？
我在使用 MPI4Py Python 模块中的 Scatter 函数时遇到问题。我的假设是我应该能够向它传递发送缓冲区的单个列表。但是，当我这样做时，或者确实添加其他两个参数，recvbuf 和 ro
python - Matplotlib 分散 3d 颜色
我的问题是，我想用与所有其他点不同的颜色绘制此结构的 0,0,0 点。但是绘图只显示所选颜色的轮廓，而这个球的内部仍然是相同的颜色其他的。我不明白这是怎么回事。 from mpl_toolkits.m
wso2 - 分散-聚集(克隆+聚合)不起作用
我正在尝试使用克隆调用两个端点并收集它们的信息以通过聚合发送，我必须将其与分散收集中介器一起使用。每个端点返回一个 json 字符串。但我一直遇到“期望 SOAP Envelope 的实现作为父级”错
javascript - 以 Angular 8 加载页面时 Css 分散
我正在构建一个 Angular 元素，我在其中使用预先设计的 html 模板。我在加载页面时使用延迟加载，我不完全知道如何描述这个问题，我只能说当我加载页面时，css 得到分散，如我附上的 gif 所
javascript - 切换(plotly.js - 分散)y 轴和迹线的可见性
plotly.js 新手(我处于 Angular 环境中) 我想将痕迹放在多选下拉菜单中。所有 y 轴都相同。能够切换这些的可见性。建议...简单/正确的方法。我尝试用 css 影响 svg 容器，
c - 使用 AVX-512 收集/分散 16 位整数
我一直在尝试弄清楚我们应该如何使用 AVX512 中的分散指令来分散 16 位整数。我所拥有的是 8 x 16 位整数，存储在 __m256i 的每个 32 位整数中。我会使用 _mm512_i32e
c - 如何通过套接字 : one buffer, 分散/聚集或 readdir 发送数据？
我正在编写一个FUSE覆盖文件系统(notifyfs)，它可以是一个数据库客户端可以从中获取数据通过查询。我的目的是使其成为缓存/overlayfs/数据库，客户端可以在显示条目及其属性(属性以及 m
c - 如何在 AVX 或 SSE 指令中进行间接加载(聚集-分散)？
我已经搜索了一段时间，但似乎无法在文档或 SO 上找到任何有用的信息。 This question并没有真正帮助我，因为它引用了修改程序集，而我正在用 C 语言编写。我有一些代码进行间接访问，我想对
python - 分散 Flask 模型时，RuntimeError : 'application not registered on db' was raised
我正在通过分散模型、蓝图来重构我的 Flask 应用程序，但我遇到了运行时错误。 def create_app(): app = flask.Flask("app") app.conf
python - 通过 python 的 matplotlib.pyplot.contourf 分散 x,y,z
大多数 pyplot 示例都使用线性数据，但如果数据是分散的呢？ x = 3,7,9 y = 1,4,5 z = 20,3,7 更好的 contourf 网格 xi = np.linspace(min
java - 分散-聚集 : combine set of Mono> into single Mono>
我可以合并 Mono> 的列表吗？数据源整合为单个Mono>包含所有项目而不阻塞？在我的带有 Lombok 分散收集应用程序的 JDK 9 Spring Boot 2 中，此阻塞版本有效:
ios - iPad Air iOS 7.1 和 iOS 8.0 中的 FFCalender + Xcode 6.0.1 + UICollectionView，月 View 分散
我正在使用 FFCalender .在那个 MonthView 中分散了在模拟器 iPad 2 8.0、iPad 2 7.0、iPad Retina 7.0 和 iPad Retina 8.0 中没

首页

博学

6Ren·AI

商城

c - MPI 分散/收集变量范围