作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在优化 MPI 代码并且正在使用 Gprof。
问题是我得到的结果完全不合理。我的工作流程如下:
-pg
作为编译标志。 mpirun -np Nproc EXEC.exe arg1 ... argN
. gprof EXEC.exe
最佳答案
运行说明gprof
通常假设程序是串行的,或单进程但多线程的。
运行 gprof
使用像 MPI 程序这样的多进程程序,你会想要
gprof
在结果上。 GMON_OUT_PREFIX
环境变量,例如在 bash 中,export GMON_OUT_PREFIX=gmon.out-
在运行 mpiexec 命令之前(然后,根据环境,您可能必须运行 mpirun -x GMON_OUT_PREFIX -np Nproc EXEC.exe arg1 ... argN
以确保每个进程都有环境变量)gprof -s EXEC.exe gmon.out-*
gprof EXEC.exe gmon.sum
(或者只检查单个文件,或一起检查文件,使用 gprof EXEC.exe gmon.out-12345
或 gprof EXEC.exe gmon.out-*
)关于mpi - 如何在 MPI 代码上从 gprof 获得有意义的结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53794093/
我是一名优秀的程序员,十分优秀!