gpt4 book ai didi

c - 如何获取CUDA内核的汇编代码?

转载 作者:太空狗 更新时间:2023-10-29 17:13:56 30 4
gpt4 key购买 nike

我有一些用 OpenCL 和 CUDA 编写的内核。在 AMD 分析器中运行 OpenCL 程序时,它允许我查看内核的汇编代码。我想将其与 CUDA 内核的汇编代码进行比较,以比较两种语言之间的编译器优化。我一直在玩 Nvidia Profiler,但仍然不知道如何获取内核的汇编代码。如何做到这一点?

最佳答案

正如 turboscrew 提到的,最接近 CUDA 汇编的是 PTX 代码。我认为在这个答案中添加实际生成 PTX 代码的方法会更有用。

这可以通过以下方式生成:

nvcc -ptx -o kernel.ptx kernel.cu

kernel.cu 是您的源文件,kernel.ptx 是目标 PTX 文件。

另外,这里是 NVidia 的 PTX 文档的链接:

http://docs.nvidia.com/cuda/parallel-thread-execution/index.html

如果您有一定的汇编知识,那么其中大部分都相当简单。有一些特殊的函数可以用在查找它们以获取更多详细信息的地方。

关于c - 如何获取CUDA内核的汇编代码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20482686/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com