gpt4 book ai didi

cuda - 在 CUDA 中读取 nvprof 的输出

转载 作者:行者123 更新时间:2023-12-03 15:47:04 25 4
gpt4 key购买 nike

我正在使用 nvprof 运行我的程序以使用以下命令获取配置文件信息:

nvprof -o profileOutput -s ./exe args

我想要关于经线发散、合并读/写、占用等的信息。但是当我打开文件 profileOutput 时,它完全是其他格式,并且有像 @^@^..... 这样奇怪的符号。

我在 vim 中打开文件。查看 CUDA 程序的配置文件信息的正确方法是什么。请帮忙。

最佳答案

你不需要-s因为它本身就是默认情况。
-o指定可以稍后导入或由 Nvidia 视觉分析器打开的输出文件,该文件不是人类可读的。

如果您需要计算占用率,您可以使用此 occupancy calculator英伟达提供。有一个 article关于它。

如果您需要跟踪分支,您可以在跟踪模式和跟踪分支中使用分析。

关于cuda - 在 CUDA 中读取 nvprof 的输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13581129/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com