gpt4 book ai didi

gcc - NVCC 单独编译,带 PTX 输出

转载 作者:行者123 更新时间:2023-12-02 21:36:38 27 4
gpt4 key购买 nike

只是为了看看 CUDA 正在生成什么样的代码,除了目标文件之外,我还喜欢编译为 ptx。由于我的一些循环展开可能需要相当长的时间,因此我希望能够编译 *.cu*.ptx*。 o 而不是浪费时间使用 *.cu*.ptx *.cu*.o,我目前正在做的事情。

只需将 -ptx 添加到 nvcc *.cu 行即可获得所需的 ptx 输出。

使用 ptxas -c*.ptx 编译为 *.o 可以工作,但会导致我的可执行文件链接出现错误:通用 ELF 中的重定位(EM:190)

尝试使用 nvcc 编译 *.ptx 失败静默,不输出任何内容。

this image is quite helpful:enter image description here

是否有一些选项需要传递给 ptxas?我应该如何通过 ptx 单独编译正确编译?或者,我可以告诉 nvcc 保留 ptx 吗?

最佳答案

Alternatively, can I just tell nvcc to keep the ptx?

是的,您可以告诉 nvcc keep all intermediate files ,其中之一是 .ptx 文件。

nvcc -keep ...

保留所有中间文件有点困惑,但我相信您可以想出一个脚本来整理事情,并且只保存您想要的文件。

关于gcc - NVCC 单独编译,带 PTX 输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21249275/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com