gpt4 book ai didi

performance - mpirun性能分析

转载 作者:太空宇宙 更新时间:2023-11-03 17:04:33 32 4
gpt4 key购买 nike

我在 Ubuntu 18.04 上的 12 个 CPU 和 2 个 GPU 上运行带有 86 个进程的 mpirun (OpenMPI)。正在运行的应用程序正在训练神经网络。

经过一天左右的训练后,迭代速度显着降低。代码在单线程上运行良好,网络流量(文件读取)完全符合规范,CPU 和 GPU 没有显示过载。

所以我认为问题出在 mpirun 上。

是否有非侵入式工具可用于显示 MPI 运行的性能?我一直在关注 Performance Co-Pilot,但我没有在软件本身中看到任何 MPI 分析。

最佳答案

Callgrind 和 kcachegrind 可能会有用。此处 [1] 的简要介绍也可能对您有所帮助。

[1] https://www.open-mpi.org/faq/?category=debugging#parallel-debuggers

关于performance - mpirun性能分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55346850/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com