gpt4 book ai didi

c++ - 使用 mpirun/mpiexec 运行时检测不使用 MPI

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:21:26 28 4
gpt4 key购买 nike

我正在编写一个程序(在 C++11 中),可以选择使用 MPI 并行运行。该项目使用 CMake 进行配置,如果找不到 MPI,CMake 会自动禁用 MPI 并显示相关警告消息。

但是,我担心一个非常合理的用例,即用户在 HPC 集群上配置和编译程序,忘记加载 MPI 模块,并且没有注意到警告。然后同一用户可能会尝试运行该程序,注意未找到 mpirun,包括 MPI 模块,但忘记重新编译。如果用户随后使用 mpirun 运行该程序,这将起作用,但该程序将只运行多次而没有任何并行化,因为 MPI 在编译时被禁用。为了防止用户认为程序是并行运行的,我想让程序在这种情况下显示一条错误消息。

我的问题是:如何在不使用 MPI 库函数的情况下检测到我的程序正在并行运行(因为 MPI 在编译时被禁用)?据我所知,mpirun 只是多次启动程序,但不会告诉它启动的进程它们是并行运行的。

我想过让程序写一些测试文件,然后检查该文件是否已经存在,但除了由于并发问题这可能很棘手之外,不能保证 mpirun 甚至会在共享文件系统的节点上启动各种进程。

我也考虑过使用系统变量在两个进程之间进行通信,但据我所知,没有系统独立的方式来做到这一点(而且,这可能会导致并发问题,因为没有办法协调各个进程之间的系统调用)。

所以目前,我的想法已经用完了,我非常感谢任何可能帮助我实现这一目标的建议。首选的解决方案应该独立于操作系统,尽管仅 UNIX 的解决方案已经很有帮助。

最佳答案

基本上,您想在非 MPI 代码路径中检测是否正在由 mpirun 等运行。有一个非常相似的问题:How can my program detect, whether it was launch via mpirun已经提出了一种非可移植解决方案。

Check for environment variables that are set by mpirun. See e.g.: http://www.open-mpi.org/faq/?category=running#mpi-environmental-variables

作为另一种选择,您可以获得 process id of the parent process它是 process name并将其与已知 MPI 启动器二进制文件列表进行比较,例如 orted,slurmstepd,hydra??1。不幸的是,关于那一切的一切都是不可移植的。

由于启动本身没有被 MPI 标准明确定义,因此没有标准的方法来检测它。

1:仅凭内存,请勿照字面理解。


从用户体验的角度来看,我认为始终显示一个清晰的消息程序是如何运行的,例如:

Running FancySimulator serially. If you see this as part of mpirun, rebuild FancySimuilator with FANCYSIM_MPI=True.

Running FancySimulator in parallel with 120 MPI processes.

会“解决”问题。收到 120 条乱码消息的用户有望注意到。

关于c++ - 使用 mpirun/mpiexec 运行时检测不使用 MPI,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41899821/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com