gpt4 book ai didi

cuda 5.0 动态并行性错误 : ptxas fatal . 未解析的外部函数 'cudaLaunchDevice

转载 作者:行者123 更新时间:2023-12-04 16:31:56 25 4
gpt4 key购买 nike

我在带有 CUDA 5 的 Linux 上使用具有计算能力 35 的 tesla k20。通过一个简单的子内核调用,它给出了一个编译错误:Unresolved extern function cudaLaunchDevice
我的命令行看起来像:

nvcc --compile -G -O0 -g -gencode arch=compute_35 , code=sm_35 -x cu -o fill.cu fill.o

我看到 cudadevrt.a在 lib64 中 .. 我们需要添加它还是需要做些什么来解决它?没有子内核调用一切正常。

最佳答案

您必须在启用可重定位设备代码的情况下显式编译并链接设备运行时库才能使用动态并行性。所以你的编译命令必须包含 --relocatable-device-code true并且链接命令(您没有向我们展示)应该包括 -lcudadevrt .

此过程在动态并行编程指南 pdf 的“动态并行的工具包支持”部分中有详细描述,可用 here .

关于cuda 5.0 动态并行性错误 : ptxas fatal . 未解析的外部函数 'cudaLaunchDevice,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13888804/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com