gpt4 book ai didi

c - OpenMPI 挂起三个节点

转载 作者:太空宇宙 更新时间:2023-11-04 04:55:08 28 4
gpt4 key购买 nike

你好:我正在为我设置一个 OpenMPI 环境,我在其中设置了三个使用无密码身份验证等的虚拟机。我有一个简单的“Hello World”样式程序已成功编译/链接:

#include <stdio.h>
#include <mpi.h>

int main(int argc, char *argv[]) {
int numprocs, rank, namelen;
char processor_name[MPI_MAX_PROCESSOR_NAME];

MPI_Init(&argc, &argv);
MPI_Comm_size(MPI_COMM_WORLD, &numprocs);
MPI_Comm_rank(MPI_COMM_WORLD, &rank);
MPI_Get_processor_name(processor_name, &namelen);

printf("Process %d on %s out of %d\n", rank, processor_name, numprocs);

MPI_Finalize();
}

我观察到的是,当我在“机器文件”中拥有三个不同节点的主机名时,作业挂起。每个单独的节点都运行良好 - 我也尝试了两个节点的组合(即三个节点中的任意两个节点),并且工作正常。因此,我可以排除任何节点不工作的可能性。

我怎样才能对此进行更多调查?谢谢!

最佳答案

printf 或文件 IO 在这里无关紧要。

我刚刚在 Open MPI 自述文件中添加了关于此的部分查看 https://svn.open-mpi.org/trac/ompi/browser/branches/v1.5/README#L1404 .简短版本:首先尝试 mpirun'ing 一些非 MPI 应用程序,例如主机名或正常运行时间。如果这些都不起作用,那么就有一些东西阻止了 OMPI 的运行时环境甚至无法正常启动(我怀疑这里正在发生这种情况)。

(如果您害怕 SSL 警告,请获取站点的 CA SSL 证书:http://www.cs.indiana.edu/Facilities/FAQ/Mail/csci.crt。它是美国印第安纳大学计算机科学系的 CA;他们是我们的托管服务提供商)

您是否禁用了防火墙?或者,如果您偏执狂,让您的防火墙保持启用状态,但在将运行 Open MPI 作业的所有节点之间启用随机 TCP 端口通信? (iptables 很难正确配置——您可能想先尝试禁用它,如果可行,然后尝试弄清楚如何允许受信任节点之间的随机 TCP 端口通信)

关于c - OpenMPI 挂起三个节点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9503289/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com