gpt4 book ai didi

cuda - 复制到 CUDA 常量内存时设备符号无效

转载 作者:行者123 更新时间:2023-12-04 23:24:01 24 4
gpt4 key购买 nike

我有几个用于图像处理应用程序的文件。由于在执行某些图像处理算法时图像的行数和列数不会改变,因此我试图将这些值放入常量内存中。我的应用程序看起来像:

Imageproc.cuh

...
...
__constant__ int c_rows;
__constant__ int c_cols;

#ifdef __cplusplus
extern "C"
{
#endif
...
...
#ifdef __cplusplus
}
#endif

Imageproc.cu
...
...

int algorithm(float *a, const int rows, const int cols){
...
...
checkCudaError(cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int)));
checkCudaError(cudaMemcpyToSymbol(&c_cols, &cols, sizeof(int)));

dim3 block(T, T);
dim3 grid(cols/T+1, rows/T+1);

kernel<<<grid, block>>>( ... );
...
...

}

它编译得很好但是当我试图运行程序时我得到 invalid device symbol cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int))
我不能把这些变量放在常量内存中还是我错过了什么?

最佳答案

如果您的符号声明如下:

__constant__ int c_rows;

然后正确调用 cudaMemcpyToSymbol只是
int rows = 5;
cudaMemcpyToSymbol(c_rows, &rows, sizeof(int)));

关于cuda - 复制到 CUDA 常量内存时设备符号无效,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16498749/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com