c++ - MPI_Reduce 是否也做 MPI_Barrier 的工作？-6ren

c++ - MPI_Reduce 是否也做 MPI_Barrier 的工作？

转载作者：太空宇宙更新时间：2023-11-03 17:24:30

27

4

由于 MPI_Reduce 和 MPI_Barrier 是开销很大的命令，所以我不得不减少一些线程间的通信。我知道 MPI_Reduce 和 MPI_Barrier 的主要工作。有时我观察到 MPI_Reduce 正在减少一个线程中的所有值，同时它也在做 MPI_Barrier 的工作。是否有可能如果我必须使用 mpi_Reduce 那么我可以跳过 MPI_Barrier？

最佳答案

不，MPI_Reduce() 不会隐式执行 MPI_Barrier()。

也就是说，MPI_Allreduce()(具有非零大小数据)执行隐式 MPI_Barrier()，因此这可能适合您的算法。

我不太确定您所说的 MPI_Barrier() is a coSTLy operation 是什么意思。假设您有一个良好的互连，屏障本身应该很快，并且花费的大部分时间应该是由进程不平衡引起的。

关于c++ - MPI_Reduce 是否也做 MPI_Barrier 的工作？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59711830/

27

4

0

文章推荐： c++ - 为什么链表重新排序失败？

文章推荐： c# - 更新 ForEach 循环内的变量

文章推荐： c# - 使用语句未处理的异常

文章推荐： c++ - QT如何将Qlist传递给类构造函数

c - MPI_Reduce 没有按预期工作
我对 MPI 很陌生，我正在尝试使用 MPI_Reduce 来查找整数数组的最大值。我有一个整数数组 arr尺寸arraysize ，这是我的代码: MPI_Init(&argc, &argv); M
fortran - MPI_REDUCE 精度问题
我在 fortran 中遇到 MPI_REDUCE() 的精度问题。我测试了两种对存储在每个节点上的 double 数字求和的方法。我使用的 MPI_REDUCE() 行是 call MPI_REDU
c - 关于 MPI_Reduce
只是一个问题。如果我使用函数 MPI_Reduce，只有根可以分配接收缓冲区，当这是一个动态数组时？。例如: int r = 10; int *yloc, *y; ... yloc = calloc(
使用 MPI_Reduce 计算数字的平均值
我正在尝试使用 MPI_reduce() 计算跨进程分布的 1000 个数字的平均值。不幸的是，到目前为止，我的代码只给出零，而不是预期的答案(数字的算术平均值)。我做错了什么？ #include
c - MPI_Reduce 是否需要接收缓冲区的现有指针？
MPI documentation断言接收缓冲区 (recvbuf) 的地址中的地址仅在根目录下才有意义。这意味着可能不会在其他进程中分配内存。 this question 证实了这一点. int M
c++ - MPI_REDUCE 一个动态计算的数组
我正在尝试在 C(或 C++)中使用 MPI_REDUCE 来查找数组中的最小值(和索引)。我有这个适用于常规数组，但现在我想切换到一个动态计算值的数组。即 arr[n] 的值是通过调用 fun(n)
c - MPI_Reduce() 程序出现段错误
我开始研究使用 C 和 OpenMPI 库进行并行编程。所以现在一切看起来都太复杂了。我正在尝试做一个单程序多数据:掌握:- 初始化一个数组- segmentation 它- 将相同大小的位发送到不
memory-leaks - MPI_REDUCE 导致内存泄漏
我最近遇到了一个堰行为。如果我在我的机器上运行以下代码(使用最新版本的 cygwin，Open MPI 版本 1.8.6)，我会得到一个线性增长的内存使用量，这很快就会淹没我的电脑。 program
sum - 如何使用 MPI_Reduce 独立地对不同处理器组的不同值求和
我试图将我的处理器分成几组，然后添加每组的总和独立地......但直到现在我还无法正确找到结果。一个简单的例子如下: int main(int argc, char** argv) { int
MPI_Send/Recv 与 MPI_Reduce
我得到了一个小练习，我必须通过使用 MPI 来估计 n 个球体的总体积来实现蒙特卡罗算法，这些球体的中心坐标和半径在 3 维中。即使我们必须使用 MPI，我们也可以在本地机器上启动所有进程，因此没有网
c - MPI_Scatter 和 MPI_Reduce
我正在尝试找到随机生成的数字的最大值。对此有任何想法... 我正在使用 MPI_Scatter 将随机生成的数字分成相等的进程。我正在使用 MPI_Reduce 从每个进程中获取最大值。 #inclu
c - MPI_Reduce w 用户函数和非连续数据
我正在尝试做一些简单的 MPI 项目(w MPICH)，但在这样做时我遇到了一个我既不理解也无法解决的问题(可能是因为我误解了文档)。所以我基本上想做的是将一个结构传递给 MPI_Reduce，以便对
c++ - 在多个节点上运行时 MPI_Reduce() 中的死锁
我的 MPI 代码有问题，当代码在多个节点上运行时挂起。它在单个节点上运行时成功完成。我不确定如何调试它。有人可以帮我调试这个问题吗？程序使用: mpicc -o string strin.c
c - MPI_Reduce 数组表示十进制值 (C)
我有一个顺序程序，它计算数值并将结果存储在一个数组中，其中每个元素代表一个数字“位置”。例如，一个计算结果[2,4,5,1,1,8,9,3,1]表示一个十进制值2.45118931 格式是resul
c - 根处理器是否也将 MPI_Reduce 应用于自身？
当使用 MPI_reduce 时，根处理器是否也对自身应用指定的 MPI 操作？例如，假设以下代码由包括 root 在内的所有处理器运行，root 是否将它的 local_sum 减少为 globa
c - 使用 MPI_Reduce 时检测到堆栈粉碎
我学会了使用一些 MPI 函数。当我尝试使用 MPI_Reduce 时，我在运行代码时收到检测到堆栈粉碎: #include #include #include void main(int ar
c++ - MPI_Comm_spawn 和 MPI_Reduce
我有两个程序。产生执行一些计算的“ worker ”的“主人”，我希望主人从 worker 那里得到结果并存储总和。我正在尝试使用 MPI_Reduce 从 worker 那里收集结果，而 worke
c - 具有包含动态分配数组的自定义数据类型的 MPI_reduce() : segmentation fault
我不明白为什么一旦我使用包含动态分配数组的自定义 MPI 数据类型，MPI_Reduce() 就会出现段错误。有人知道吗？以下代码在 MPI_Reduce() 内部使用 2 个处理器时会崩溃。但是，
c - 在 C 语言中使用 MPI_Reduce
我正在尝试使用 MPI 库用 C 语言编写程序。在我的程序中，我正在解决 TSP(但没有使用任何特殊算法......)。我的输入参数是int nCites , int xCoord[]和 int yC
c++ - 在 MPI_Reduce 中传递和插入 vector
我需要缩减节点从其他节点获取元素列表的拷贝(存储在 vector 中)。我定义了自己的还原函数，但它不起作用。程序终止/崩溃。这是代码: #include #include "mpi.h" #in

首页

博学

6Ren·AI

商城

c++ - MPI_Reduce 是否也做 MPI_Barrier 的工作？