gpt4 book ai didi

fortran - Fortran+openMP 的简单分析?

转载 作者:行者123 更新时间:2023-12-02 19:36:40 25 4
gpt4 key购买 nike

我一直在使用 gprof 对代码进行基准测试,但自从我开始并行化它以来,我意识到 gprof 无法提供有用的输出。

我如何分析或采取一些措施来帮助找到瓶颈?

我听说过 ScalascaTAU,但它们似乎有点矫枉过正。

最佳答案

最简单使用的工具是 perf 。它可以轻松be installed在任何 Linux 系统上,并且与 OpenMP 或其他线程应用程序配合得很好。

您只需在命令行上运行 sudo perf top 即可查看实时性能。这将告诉您当前消耗最多 CPU 资源的函数和源代码行,例如 top 对整个进程的消耗。

在您的应用程序中添加前缀:

perf record ./your-program your-parameter
perf report

将提供基于函数和源代码行的配置文件。有许多参数可以调整perf,例如通过使用 -g 启用调用图跟踪。

但是,虽然支持线程,但您无法轻松区分它们。因此您不会知道哪个线程显示了哪些性能特征。为此,您应该求助于更专业的 HPC 工具,即使它们看起来有点过分。您必须考虑到分析并行性能并不简单。无论您使用什么工具。

免费工具是:

  • HPCToolkit :使用最简单,因为它仅使用采样,因此无需重新编译您的应用程序
  • Score-P用于记录和Cube用于分析个人资料(网站似乎暂时关闭)
  • Tau

关于fortran - Fortran+openMP 的简单分析?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41069586/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com