gpt4 book ai didi

cuda - GTX 980 ti : Unknown Error 上的动态并行

转载 作者:行者123 更新时间:2023-12-02 03:01:50 26 4
gpt4 key购买 nike

我正在 GTX 980 ti 卡上尝试动态并行。所有运行代码的尝试都会返回“未知错误”。下面显示了带有编译选项的简单代码。

我可以毫无问题地在 depth=0 执行内核。第一次调用child时报错。cudaDeviceSynchronize() 在查看此处的其他问题后被包含在内,但没有解决问题。

有什么想法吗?这可能是驱动程序问题吗?

编辑 1:

操作系统:Linux-x86_64

Nvidia 驱动版本:384.59

nvcc 版本 7.5.17

有两个 980 ti 与 PCIe x16 Gen3 相连。该系统还在另一个配置了 RAID 的 SSD 上安装了 Windows。

#include <cuda.h>
#include <fstream>
#include <stdio.h>
#include <stdlib.h>

__global__ void ker_two(){
int two=0;
two++;
}

__global__ void ker_one(){
int one=0;
one++;
ker_two<<<1,1>>>();
cudaDeviceSynchronize();
};

int main( ){

ker_one<<<1,1>>>();
cudaDeviceSynchronize();

cudaError_t err = cudaGetLastError();
if (err != cudaSuccess)
printf("Cuda Error: %s\n", cudaGetErrorString(err));//*/

return 0;
}

编译为

nvcc -arch=compute_52 -rdc=true -lcudadevrt test.cu

最佳答案

我能够(?)在装有 Maxwell Titan 卡的机器上重现错误。这是一个手动安装了 CUDA 8.0.61 的 Fedora 24 发行版。驱动版本为 375.51。

但是,问题似乎只发生在我的系统上,当我在 ker_one() 中调用 cudaDeviceSynchronize() 时,无论我是调用第二个内核还是不是。所以也许这就是您看到的问题,而不是动态并行性本身。

考虑到@talonmies 的评论,这甚至可能只是一个驱动程序问题。

关于cuda - GTX 980 ti : Unknown Error 上的动态并行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45402578/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com