gpt4 book ai didi

cuda - 如何使用CUDA 8.0 nvprof剖析OpenCL应用程序

转载 作者:行者123 更新时间:2023-12-04 04:24:34 26 4
gpt4 key购买 nike

我正在尝试在具有NVIDIA TITAN X和CUDA 8.0的系统中分析OpenCL应用程序a.out

如果是CUDA应用程序,那么nvprof ./a.out就足够了。但是我发现这不适用于OpenCL应用程序,并显示一条消息“未分析内核”。

在CUDA 7.5之前,我成功地使用了this之后的COMPUTE_PROFILE=1。不幸的是,文档说“在CUDA 8.0版本中已经删除了对使用环境变量COMPUTE_PROFILE的命令行分析器的支持。”

问题是,除了将CUDA降级以使用nvprof剖析OpenCL应用程序之外,还有其他方法吗?

最佳答案

据我所知,nvprof从未支持过OpenCL分析。

使用COMPUTE_PROFILE=1运行代码会调用基于驱动程序的分析机制,该机制早于nvprof的引入。基于驱动程序的机制已经过时了,从CUDA 8开始已被删除,转而使用nvprof

结果,似乎无法使用CUDA工具包分析在NVIDIA硬件上运行的OpenCL代码。

关于cuda - 如何使用CUDA 8.0 nvprof剖析OpenCL应用程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41698992/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com