python - 对于大型数组，MPI.Gather 调用挂起-6ren

python - 对于大型数组，MPI.Gather 调用挂起

转载作者：行者123 更新时间：2023-12-01 08:18:47

26

4

我使用 mpi4py 并行化我的 Python 应用程序。我注意到，每当我将进程数量或涉及的数组大小增加太多时，我都会在 MPI.Gather 期间遇到死锁。

示例:

from mpi4py import MPI

import numpy as np

COMM = MPI.COMM_WORLD
RANK = COMM.Get_rank()
SIZE = COMM.Get_size()


def test():
    arr = RANK * np.ones((100, 400, 15), dtype='int64')

    recvbuf = None
    if RANK == 0:
        recvbuf = np.empty((SIZE,) + arr.shape, dtype=arr.dtype)

    print("%s gathering" % RANK)
    COMM.Gather([arr, arr.size, MPI.LONG], recvbuf, root=0)
    print("%s done" % RANK)

    if RANK == 0:
        for i in range(SIZE):
            assert np.all(recvbuf[i] == i)


if __name__ == '__main__':
    test()

执行此命令会给出:

$ mpirun -n 4 python bug.py 
1 gathering
2 gathering
3 gathering
0 gathering
1 done
2 done

而进程 0 和 3 无限期挂起。但是，如果我将数组维度更改为 (10, 400, 15)，或使用 -n 2 运行脚本，一切都会按预期运行。

我错过了什么吗？这是 OpenMPI 或 mpi4py 中的错误吗？

平台:

OSX Mojave
OpenMPI 4.0.0(通过 Homebrew)
mpi4py 3.0.1
Python 3.7

最佳答案

我刚刚注意到通过 Homebrew 与 MPICH 一切正常。因此，如果有人在 OSX 上遇到类似的情况，解决方法是

$ brew unlink open-mpi
$ brew install mpich
$ pip uninstall mpi4py
$ pip install mpi4py --no-cache-dir

然后，我必须编辑 /etc/hosts 并添加行

127.0.0.1     <mycomputername>

为了 MPICH 正常工作。

更新:

现在，这个问题应该已经解决了。 The bug was reported并将 OpenMPI 更新到 4.0.1 为我解决了这个问题。

关于python - 对于大型数组，MPI.Gather 调用挂起，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54811518/

26

4

0

文章推荐： php - 使用 $.each 迭代 PHP 数组

文章推荐： image - OpenCL 创建错误的颜色

解析Pytorch中的torch.gather()函数
参数说明以官方说明为例，gather()函数需要三个参数，输入input，维度dim，以及索引index input必须为Tensor类型 dim为int类型，代表从哪个维度进行索引 in
r - dplyr:gather 中的两个键
我知道如何在 melt 中使用两个 id.vars .这很简单: x = data.frame(subject = c("John", "Mary"), time = c
r - 无法将 "gather"输出的列名称更改为默认名称以外的任何名称
我正在尝试使用 gather在 tidyr包，但我无法从默认名称更改输出的列名称。例如: df = data.frame(time = 1:100,a = 1:100,b = 101:200) df.
python - 带有生成器表达式的 asyncio.gather
为什么 asyncio.gather 不适用于生成器表达式？ import asyncio async def func(): await asyncio.sleep(2) # Works a
R:使用 Gather() 来整理具有两个列标题的数据
我想整理一些不幸的是在前两行中设置了两个列标题的数据: 第一行(标题):实际上是度量的类型(例如。估计、标准误差、上限、下限)。第二行(也是标题):是度量的年份。有什么方法可以使用gather()
NuGet "Gather Dependencies"挂起
当我添加 NuGet 包(最新版本的 NuGet 和 Visual Studio 2015)时，它在安装包之前在“尝试收集依赖项”处挂起大约 5 分钟。我可以指向 NuGet.org、我们的内部服务器
r - 在melt/gather 中为新列指定类
我想在 melt 中指定输出列的类别(或 gather)。我想为所有列和不同的类做这件事。例如，我有一些数据: example example day max min 1 1 20
R tidyr gather() 基于查找的两组列
我有一个按地区进行满意度调查的结果数据集。调查中的每个问题都采用 4 分制评分(从非常满意到非常不满意)。数据集中的每一行都包含给定“财政年度”结束时给定区域中给定问题的汇总结果。它还包含每个级别的受
r - 键排序与使用 gather() 的原始列排序
键排序是否取决于我是否首先列出要收集的列与不收集的列？这是我的数据框: library(tidyr) wide_df <- data.frame(c("a", "b"), c("oh", "ah")
python - 在超时中包装 asyncio.gather
我见过asyncio.gather vs asyncio.wait ，但不确定这是否解决了这个特定问题。我想做的是将 asyncio.gather() 协程包装在 asyncio.wait_for()
c++ - AVX2 Gather 指令使用细节
我正在尝试了解 AVX2 intel intrinsic 的收集功能。根据官方文档Link ，函数定义为， __m256i _mm256_i32gather_epi32 (int const* ba
c - MPI Gather 仅从根进程收集
首先，我一直在使用 this code作为引用，它显示了不使用 MPI_Scatter 的 MPI_Gather 的使用，因为这就是我在这里想要实现的目标。我已经为此工作了很长时间，只是无法弄清楚这个
c - MPI Gather 没有按预期合并数组
我正在使用 MPI 开发 mandelbrot 生成器，它在完成时输出 PPM 文件。我使用 MPI gather 将计算结果 block 收集到最终数组中。代码生成文件但不完整；仅显示图片的上半部分
r - 在 gather 函数中使用变量
我正在使用 R 将宽格式数据表转换为长格式。它有效，除了必须为新列使用变量: library(readr) library(tidyr) files <- Sys.glob("sources/*.cs
python - 使用 asyncio.gather 不会引发内部异常
使用 Python 3.7，我试图捕获异常并通过 following an example I found on StackOverflow 重新引发它.虽然该示例确实有效，但它似乎并不适用于所有情况
r 使用 dplyr 'gather' 函数
我有一个数据框，看起来像下面“输入”中显示的图片。我尝试每行获取 1 个日期(请参见下面“所需输出”中的图片)。换句话说，我尝试为每一行做一种“转置”。让我们规定组合 'LC' 和 'Prod'
python - 使用索引张量和 tf.gather 对张量进行切片
我正在尝试使用索引张量对张量进行切片。为此，我尝试使用 tf.gather . 但是，我很难理解 documentation并且不要让它像我期望的那样工作: 我有两个张量。安 activations形
r - Gather() 列出列到 R 中的行
我想 gather() 列出列以在我的数据框中创建新行。我正在使用 repurrrsive 包中的《权力的游戏》数据集。下面是我设置问题的代码: library(tidyverse) got_char
python - 如何在 asyncio.gather 中使用条件逻辑？
我想有条件地运行异步函数，如下所示: one, two, three = await asyncio.gather( some_async_method1(), some_async_
python - 带轴参数的 Tensorflow tf.gather
我正在使用tensorflow的tf.gather从多维数组中获取元素，如下所示: import tensorflow as tf indices = tf.constant([0, 1, 1]) x

首页

博学

6Ren·AI

商城

python - 对于大型数组，MPI.Gather 调用挂起

示例:

平台: