gpt4 book ai didi

ubuntu - 每当我使用主机文件时出现 MPIRUN 段错误

转载 作者:太空宇宙 更新时间:2023-11-03 16:55:54 24 4
gpt4 key购买 nike

我正在尝试运行我在两台机器上使用 MPI 编写的程序。当使用 MPIRUN 启动时,它在本地机器上使用 4 个内核运行得非常好。我已经配置了ssh,这样本地机器就可以不用密码登录远程机器了。每当我运行 MPIRUN 并指定主机文件时,我都会收到段错误和“地址未映射:(某些地址)”。每次运行时地址都会改变。有时它只是(零)。当我尝试使用主机文件并运行 ring_c 示例时,也会发生这种情况。我在两台计算机上都安装了 OpenMPI 3.1.2,并为与作业关联的用户安装了 OpenMPI 3.1.2。

主机文件内容

localhost
mpiuser@192.168.1.236

我也试过在主机文件中使用主机名 ubuntu-vm。这个主机名在我的/etc/hosts 文件中。当我键入 ssh mpiuser@ubuntu-vm 或 ssh mpiuser@192.168.1.236 时,它会毫无问题地登录,并且没有密码提示。我已尝试在两台计算机上多次重新安装 OpenMPI。

这可能是 OpenMPI 的特定问题吗? mpich 可能有效吗?我不明白为什么这很难开始工作。我假设使用标准安装说明并运行示例程序不会有问题。

我在两台机器上都使用 ubuntu 18.04。远程机器是 Windows 10 主机中的虚拟机。桥接网络适配器配置。在我尝试运行它们之前,我将这些程序放入一个共享文件夹中,该文件夹可从两台机器访问。如果我之前的陈述不清楚,示例程序 ring_c 在多台机器上运行时也会失败,但在本地机器上不会。

命令行:

MPIRUN -np 8 --hostfile hostfile ./ring_c

示例错误输出:

======================   ALLOCATED NODES   ======================
ubuntu-desktop: flags=0x11 slots=4 max_slots=0 slots_inuse=0 state=UP
192.168.1.236: flags=0x10 slots=1 max_slots=0 slots_inuse=0 state=UNKNOWN
=================================================================
[ubuntu-desktop:11654] *** Process received signal ***
[ubuntu-desktop:11654] Signal: Segmentation fault (11)
[ubuntu-desktop:11654] Signal code: Address not mapped (1)
[ubuntu-desktop:11654] Failing at address: 0x10

最佳答案

这是 Open MPI 中的一个真正错误(双重错误),它已在 https://github.com/open-mpi/ompi/pull/5863master 分支中修复。 .

与此同时,您可以手动下载并应用可用的补丁 https://github.com/open-mpi/ompi/pull/5869

请注意 Open MPI 用户邮件列表或 github 存储库 ( https://github.com/open-mpi/ompi ) 是报告此类问题的最佳场所。(mpirun 应该永远不会崩溃,所以不太可能是编程错误)

关于ubuntu - 每当我使用主机文件时出现 MPIRUN 段错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52707242/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com