gpt4 book ai didi

gcc - NVCC 单独编译与 PTX 输出

转载 作者:行者123 更新时间:2023-12-02 04:39:18 26 4
gpt4 key购买 nike

为了查看 CUDA 生成的代码类型,除了目标文件外,我还喜欢编译为 ptx。由于我的一些循环展开可能需要相当长的时间,所以我希望能够编译 *.cu*.ptx*。 o 而不是在 *.cu*.ptx 上浪费时间*.cu*.o,这是我目前正在做的。

只需将 -ptx 添加到 nvcc *.cu 行即可获得所需的 ptx 输出。

使用 ptxas -c*.ptx 编译为 *.o 可以,但会导致我的可执行文件链接出错:通用 ELF 中的重定位(EM:190)

尝试使用 nvcc 编译 *.ptx 失败默默地,没有任何输出。

this image is quite helpful:enter image description here

我需要将一些选项传递给 ptxas 吗?我应该如何通过单独编译的 ptx 正确编译?或者,我可以只告诉 nvcc 保留 ptx 吗?

最佳答案

Alternatively, can I just tell nvcc to keep the ptx?

是的,你可以告诉 nvcc keep all intermediate files ,其中之一将是 .ptx 文件。

nvcc -keep ...

保留所有中间文件有点乱,但我相信你可以想出一个脚本来整理这些东西,只保存你想要的文件。

关于gcc - NVCC 单独编译与 PTX 输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21249275/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com