gpt4 book ai didi

cuda - 如何检索 CUDA 4.0+ 内核的参数列表信息?

转载 作者:行者123 更新时间:2023-12-01 19:59:55 24 4
gpt4 key购买 nike

根据 NVidia 文档 cuLaunchKernel function ,使用 CUDA 3.2+ 编译的内核包含有关其参数列表的信息。有没有办法以编程方式从 CUfunction 句柄检索此信息?我需要从内核的 CUfunction 句柄中了解内核的参数数量和每个参数的大小(以字节为单位)。我已经看到上面引用的 NVidia 文档说存在此信息,但我没有在 CUDA 文档中看到任何地方表明以编程方式访问此信息。

添加更多说明:我正在使用中间件系统。它的前端库取代了目标系统上的 libcuda(驱动程序 API 库)。然后,后端作为守护进程在另一台使用 GPGPU 资源的主机上运行,​​并调用该机器上的真实 libcuda。还有其他中间件解决方案已经使用 cuLaunchKernel 执行此操作,因此这绝对是可能的。此外,CUDA 本身使用此信息来了解如何解析传递到 cuLaunchKernel 的指针中的参数。

编辑:我最初的 CUDA 版本中引入了错误的元数据。根据cuLaunchKernel documentation,它是 3.2,而不是 4.0。 .

最佳答案

cuLaunchKernel 旨在启动您知道其函数原型(prototype)的内核。没有用于“逆向工程”函数原型(prototype)的 API。

关于cuda - 如何检索 CUDA 4.0+ 内核的参数列表信息?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13795329/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com