- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在编译 CUDA 代码时收到以下我不理解的警告:
CUDACOMPILE : ptxas warning : Stack size for entry function
'_Z24gpu_kernel_get_3d_pointsiPK8RtmPointS1_PKfS3_P10RtmPoint3DPif' cannot be statically
determined.
__global__ void gpu_kernel_get_3d_points(int count1, const RtmPoint *pPoints1,
const RtmPoint *pPoints2, const float *PL, const float *PR, RtmPoint3D *pPoints3D,
int *pGlobalCount, float bbox)
最佳答案
当函数递归时会发生此警告。 Cuda 尝试在执行之前分配堆栈空间,这没什么大不了的,除非您使用递归。它的问题是堆栈大小是不可预测的。递归的深度不是已知值,因此堆栈将使用的内存是未知的。此警告并不真正相关,但如果您的数据超出 GPU 堆栈,则必须手动增加堆栈大小。
关于CUDA ptxas 警告(入口的堆栈大小),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9950599/
我在编译 CUDA 代码时收到以下我不理解的警告: CUDACOMPILE : ptxas warning : Stack size for entry function '_Z24gpu_kerne
我正在使用 CUDA,我创建了一个 int2_ 类来处理复杂的整数。 ComplexTypes.h 文件中的类声明如下: namespace LibraryNameSpace { class
我正在尝试了解我的每个 CUDA 线程的资源使用情况,以用于手写内核。 我使用 nvcc -arch=sm_20 -ptxas-options=-v 将我的 kernel.cu 文件编译为 kerne
我在带有 CUDA 5 的 Linux 上使用具有计算能力 35 的 tesla k20。通过一个简单的子内核调用,它给出了一个编译错误:Unresolved extern function cuda
我正在尝试使用 thrust::sort 在我的 GPU 上对结构数组进行排序。但是,当我使用 nvcc 编译时,我收到此警告: ptxas/tmp/tmpxft_00005186_00000000-
当我尝试构建 a Windows port of Faster-RCNN 时出现 nvcc fatal : '--ptxas-options=-v': Expected a number 错误。您可以
已关闭。此问题需要 debugging details 。目前不接受答案。 编辑问题以包含 desired behavior, a specific problem or error, and the
我以前从未使用过 CUDA 或 C++,但我正在尝试让 Ramses GPU 从 ( http://www.maisondelasimulation.fr/projects/RAMSES-GPU/ht
我是一名优秀的程序员,十分优秀!