gpt4 book ai didi

cuda - 如何在 NVIDIA 的可视化分析器中包含主机功能的计时?

转载 作者:行者123 更新时间:2023-12-01 05:11:33 38 4
gpt4 key购买 nike

我有一个程序,我在其中尝试将主机功能与 GPU 内核重叠。为了检查主机功能与 GPU 内核重叠的范围,我使用了 NVIDIA 的可视化分析器。但是,探查器不会显示我的主机函数的任何计时结果。相反,它只显示 CUDA 内核的 CPU 时间。

有什么方法可以将宿主函数的计时结果整合到可视化分析器的时间线中吗?

最佳答案

是的,这是可能的。查看 NVIDIA 工具扩展 API,它记录在 profiler manual 中。 .

您可能想要 mark a range围绕要检查重叠的主机代码部分。

关于cuda - 如何在 NVIDIA 的可视化分析器中包含主机功能的计时?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16603100/

38 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com