- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在尝试使用 MPI 库解决一个简单的程序。
进程0上存储了4*N×4*N的矩阵,矩阵每边的长度为DIM LEN = 4*N。我需要创建一个对角数据类型。但是,数据类型应该只覆盖对角线上的 N 个连续元素,而不是 4*N。然后我必须使用创建的数据类型在 MPI 程序的进程之间平均分配该矩阵的对角线。总数进程数为 4。
散射后我无法正确接收对角线元素。
Non root : 3
Non root : 1
2.000000 0.000000
6.000000 0.000000
Non root : 2
4.000000 0.000000
这是程序
#include "mpi.h"
#include <stdio.h>
#define DIM_LEN 8
int main( int argc, char *argv[] )
{
int myid, numprocs;
double mat[DIM_LEN][DIM_LEN];
double matRcv[DIM_LEN/4];
int i,j;
MPI_Datatype diagonal;
MPI_Init(&argc,&argv);
MPI_Comm_size(MPI_COMM_WORLD,&numprocs);
MPI_Comm_rank(MPI_COMM_WORLD,&myid);
MPI_Type_vector(DIM_LEN/4, 1, DIM_LEN +1 , MPI_DOUBLE, &diagonal);
MPI_Type_commit(&diagonal);
if (myid == 0){
printf("Root : %d \n",myid);
for ( i=0; i<DIM_LEN; i++)
for ( j=0; j<DIM_LEN; j++ )
mat[i][j] = i+j;
for ( i=0; i<DIM_LEN; i++){
for ( j=0; j<DIM_LEN; j++ ){
printf("%lf \t",mat[i][j] );
}
printf("\n");
}
/* Scatter the big table to everybody's little table */
}
MPI_Scatter(&mat[0] , 1, diagonal, &matRcv ,1, diagonal, 0, MPI_COMM_WORLD);
MPI_Barrier(MPI_COMM_WORLD);
if(myid != 0){
printf("Non root : %d \n",myid);
for ( i=0; i<DIM_LEN/4; i++)
printf("%lf ",matRcv[i] );
printf("\n");
}
MPI_Type_free(&diagonal);
MPI_Finalize();
return 0;
}
最佳答案
好的。现在您已经正确跨越了您的 diagonal
数据类型,您的数据类型应该正确地反射(reflect)了您在二维数组 mat
中所需的内存位置。但是请注意,您的 diagonal
数据类型并不反射(reflect)您最终希望在一维数组 matRcv
中的内存位置。您要接收的内存位置是 DIM_LEN/4
从 matRcv[0]
开始的连续内存槽。您可以创建第二个数据类型来描述此内存映射(使用 MPI_Type_contiguous
),或者更轻松地将其称为 DIM_LEN/4
doubles
。
因此,您的 MPI_Scatter
调用应如下所示:
MPI_Scatter(&mat[0], 1, diagonal, &matRcv, DIM_LEN/4, MPI_DOUBLE, 0, MPI_COMM_WORLD);
另请注意,这是一个阻塞集合,因此在调用它之后不需要 MPI_Barrier()
;屏障是隐含的。
关于c++ - MPI_Scatter,分散对角元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35615980/
TL;DR:问题:是否有一种快速方法可以在特定坐标处插入分散的二维数据集? 如果是的话,有人可以提供一个示例,其中包含“当前解决方案”中使用的示例数据和变量(因为我自己实现它显然很愚蠢)。 问题:
我正在使用 n = 2 运行我的代码。我一直在尝试研究,但我不明白为什么当我尝试多次运行我的代码时会获得不同的输出。 在下面,您可以看到当我使用 n = 2 运行时的输出,并且我的 txt.file
我正在处理 BML 自动机的 MPI 版本,但 MPI_Scatter() 不会像我预期的那样工作。我读了here对于集体通信功能,每个进程都需要它的数组副本,只是没有初始化的分配空间。在我的代码中,
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 6 年前。 Improve
我需要将输入字符串拆分为输出字符串(按一定顺序)通过在输入字符串上应用一组正则表达式。我想实现这个功能与 akka Actor 集群一起使用,我将其分散正则表达式和输入字符串并收集字符串。不过我想知道
我在使用 MPI4Py Python 模块中的 Scatter 函数时遇到问题。我的假设是我应该能够向它传递发送缓冲区的单个列表。但是,当我这样做时,或者确实添加其他两个参数,recvbuf 和 ro
我的问题是,我想用与所有其他点不同的颜色绘制此结构的 0,0,0 点。但是绘图只显示所选颜色的轮廓,而这个球的内部仍然是相同的颜色其他的。我不明白这是怎么回事。 from mpl_toolkits.m
我正在尝试使用克隆调用两个端点并收集它们的信息以通过聚合发送,我必须将其与分散收集中介器一起使用。每个端点返回一个 json 字符串。但我一直遇到“期望 SOAP Envelope 的实现作为父级”错
我正在构建一个 Angular 元素,我在其中使用预先设计的 html 模板。我在加载页面时使用延迟加载,我不完全知道如何描述这个问题,我只能说当我加载页面时,css 得到分散,如我附上的 gif 所
plotly.js 新手(我处于 Angular 环境中) 我想将痕迹放在多选下拉菜单中。所有 y 轴都相同。能够切换这些的可见性。建议...简单/正确的方法。 我尝试用 css 影响 svg 容器,
我一直在尝试弄清楚我们应该如何使用 AVX512 中的分散指令来分散 16 位整数。我所拥有的是 8 x 16 位整数,存储在 __m256i 的每个 32 位整数中。我会使用 _mm512_i32e
我正在编写一个FUSE覆盖文件系统(notifyfs),它可以是一个数据库客户端可以从中获取数据通过查询。我的目的是使其成为缓存/overlayfs/数据库,客户端可以在显示条目及其属性(属性以及 m
我已经搜索了一段时间,但似乎无法在文档或 SO 上找到任何有用的信息。 This question并没有真正帮助我,因为它引用了修改程序集,而我正在用 C 语言编写。 我有一些代码进行间接访问,我想对
我正在通过分散模型、蓝图来重构我的 Flask 应用程序,但我遇到了运行时错误。 def create_app(): app = flask.Flask("app") app.conf
大多数 pyplot 示例都使用线性数据,但如果数据是分散的呢? x = 3,7,9 y = 1,4,5 z = 20,3,7 更好的 contourf 网格 xi = np.linspace(min
我可以合并 Mono> 的列表吗?数据源整合为单个Mono>包含所有项目而不阻塞? 在我的带有 Lombok 分散收集应用程序的 JDK 9 Spring Boot 2 中,此阻塞版本有效:
我正在使用 FFCalender .在那个 MonthView 中分散了 在模拟器 iPad 2 8.0、iPad 2 7.0、iPad Retina 7.0 和 iPad Retina 8.0 中没
我是一名优秀的程序员,十分优秀!