作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个CUDA代码,其工作方式如下:
cpyDataGPU --> CPU
while(nsteps){
cudaKernel1<<<,>>>
function1();
cudaKernel2<<<,>>>
}
cpyDataGPU --> CPU
function1{
cudaKernel3<<<,>>>
cudaKernel4<<<,>>>
cpyNewNeedDataCPU --> GPU // Error line
cudaKernel5<<<,>>>
}
最佳答案
您链接的文档还说:
Note that this function may also return error codes from previous, asynchronous launches.
cudaMemcpy()
时,程序将等待所有之前的GPU工作完成(请记住内核启动是异步的),然后检查状态并执行memcpy(如果一切正常)。但是,在这种情况下,您的一个内核已失败。
cudaErrorLaunchFailure : An exception occurred on the device while executing a kernel. Common causes include dereferencing an invalid device pointer and accessing out of bounds shared memory. The device cannot be used until cudaThreadExit() is called. All existing device memory allocations are invalid and must be reconstructed if the program is to continue using CUDA.
cudaDeviceSynchronize()
并检查返回值来确定哪个内核失败。
关于cuda - 使用cudaMemcpy : cudaErrorLaunchFailure时出现奇怪的错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10305715/
我有这个简单的内核代码: template __global__ void CalcHamming( const T* pData, const uint64_t u64Count, const T
我是一名优秀的程序员,十分优秀!