- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我一直在尝试编写一个 CUDA 代码(部分取自 Yuval Fisher 的分形图像压缩),该代码具有指向 2D 图像的双指针。处理完 this 中的指针分配后,我仍然收到段错误错误以及“警告:无法判断指针指向什么,假设全局内存空间”警告。这是完整的code 。我也将其发布在这里,如下所示:(对于重复发布的代码,我深表歉意)
#include <cuda.h>
#include <stdio.h>
#include <stdlib.h>
#define hsize 256
#define vsize 256
#define IMAGE_TYPE unsigned char
__global__ void kernel(IMAGE_TYPE matrixin[][hsize], IMAGE_TYPE matrixout[][hsize]) {
int tid=threadIdx.x;
int bid=blockIdx.x;
matrixout[bid][tid]=matrixin[bid][tid];
}
int fatal(char* s) {
fprintf(stderr,"%s\n",s);
return 1;
}
#define matrix_allocate(matrix,hsize,vsize,TYPE) {\
TYPE *imptr;\
int _i;\
matrix=(TYPE**)malloc((vsize)*sizeof(TYPE*));\
imptr=(TYPE*)malloc((long)(hsize)*(long)(vsize)*sizeof(TYPE));\
if(imptr==NULL)\
fatal("\nNo memory in matrix allocate.");\
for(_i=0;_i<vsize;++_i,imptr+=hsize)\
matrix[_i] = imptr;\
}\
int main() {
typedef IMAGE_TYPE IMarray[vsize][hsize];
IMAGE_TYPE **hin_image,**hout_image;
IMarray *din_image,*dout_image;
//allocate host memory
matrix_allocate(hin_image,hsize,vsize,IMAGE_TYPE)
for(int i=0;i<vsize;i++)
for(int j=0;j<hsize;j++)
hin_image[i][j]='a';
matrix_allocate(hout_image,hsize,vsize,IMAGE_TYPE)
//allocate device memory
cudaMalloc((void**)&din_image,(vsize*hsize)*sizeof(IMAGE_TYPE));
cudaMalloc((void**)&dout_image,(vsize*hsize)*sizeof(IMAGE_TYPE));
cudaMemcpy(din_image,hin_image, (vsize*hsize)*sizeof(IMAGE_TYPE),cudaMemcpyHostToDevice);
dim3 threads(hsize,1,1);
dim3 blocks(vsize,1,1);
kernel<<<blocks,threads>>>(din_image,dout_image);
cudaMemcpy(hout_image,dout_image,(vsize*hsize)*sizeof(IMAGE_TYPE),cudaMemcpyDeviceToHost);
for(int i=0;i<10;i++) {
printf("\n");
for(int j=0;j<10;j++)
printf("%c\t",hout_image[i][j]);
}
printf("\n");
cudaFree(din_image);
cudaFree(dout_image);
free(hin_image);
free(hout_image);
return 0;
}
我想知道内核函数内图像的标准 2D 访问有什么问题。非常欢迎任何帮助。
最佳答案
我不会尝试整理你复杂的矩阵分配方案。我建议的目的是让您可以将事情简化为简单的 1 行分配。
此外,我认为您并没有真正理解我给出的例子。这是一个 3D 示例,typedef 有 2 个下标。 2D 版本将具有带有单个下标的 typedef。
实际上这一切都与 CUDA 无关。它围绕着对 C 数组和指针的理解。
这些是我为使您的代码正常运行而所做的主要更改:
#include <stdio.h>
#include <stdlib.h>
#define hsize 256
#define vsize 256
#define IMAGE_TYPE unsigned char
__global__ void kernel(IMAGE_TYPE matrixin[][hsize], IMAGE_TYPE matrixout[][hsize]) {
int tid=threadIdx.x;
int bid=blockIdx.x;
matrixout[bid][tid]=matrixin[bid][tid];
}
int fatal(char* s) {
fprintf(stderr,"%s\n",s);
return 1;
}
int main() {
typedef IMAGE_TYPE IMarray[hsize];
IMarray *hin_image,*hout_image;
IMarray *din_image,*dout_image;
//allocate host memory
hin_image = (IMarray *)malloc(hsize*vsize*sizeof(IMAGE_TYPE));
hout_image = (IMarray *)malloc(hsize*vsize*sizeof(IMAGE_TYPE));
for(int i=0;i<vsize;i++)
for(int j=0;j<hsize;j++)
hin_image[i][j]='a';
//allocate device memory
cudaMalloc((void**)&din_image,(vsize*hsize)*sizeof(IMAGE_TYPE));
cudaMalloc((void**)&dout_image,(vsize*hsize)*sizeof(IMAGE_TYPE));
cudaMemset(dout_image, 0, (vsize*hsize)*sizeof(IMAGE_TYPE));
cudaMemcpy(din_image,hin_image, (vsize*hsize)*sizeof(IMAGE_TYPE),cudaMemcpyHostToDevice);
dim3 threads(hsize,1,1);
dim3 blocks(vsize,1,1);
kernel<<<blocks,threads>>>(din_image,dout_image);
cudaMemcpy(hout_image,dout_image,(vsize*hsize)*sizeof(IMAGE_TYPE),cudaMemcpyDeviceToHost);
for(int i=0;i<10;i++) {
printf("\n");
for(int j=0;j<10;j++)
printf("%c\t",hout_image[i][j]);
}
printf("\n");
cudaFree(din_image);
cudaFree(dout_image);
free(hin_image);
free(hout_image);
return 0;
}
关于c - 处理 CUDA 中指向指针的图像指针,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23204820/
有人能给我解释一下我下面程序中的一点吗我编写的以下程序是为了理解 int * const * var 的含义; #include "iostream" using namespace std ; in
我正在摆弄 C 中的指针,但仍然不确定一些非常基础的知识。我想出了以下示例代码: #include int main(void) { int num = 42; /
以下代码产生警告: const char * mystr = "\r\nHello"; void send_str(char * str); void main(void){ send_str
我正在尝试在我的 Linux 计算机上升级 cmake。这是我使用的命令。 删除旧的 cmake: sudo apt purge --auto-remove cmake 从 https://cmake
我试图借助 char 指针来追踪 union 第一个字节的值。我假设 byte1 的输出应该是 ff,但实际上是 ffffffff。如果我错了请纠正我。 #include #include #in
我正在使用微 Controller 进行一些 ADC 测量。当我尝试使用 -O2 优化编译以下代码时遇到问题,当代码中存在 PrintVal() 函数时,MCU 卡住。我做了一些调试,结果发现,当我添
#include #include using namespace std; int main () { vector qwerty; qwerty.push_back(5);
我有我的 woking setup.py 文件;其中包含以下行: home = os.environ["HOME"] # home = /home/dr in my machine; distu
这段代码 #include #include static_assert(std::is_same_v::value_type, volatile int>); 在最新的 GCC 和 clang
我对 C 中的前向声明有疑问。 代码 typedef struct yhash_s t_yhash;// forward declaration struct yhash_s { size_t
我想提取成员指针指向的成员的类型。 template void demo(myClass& instance, void* ptr) { instance.*member = *reinter
我正在尝试使用指针将一段 C 代码转换为 Swift 3。这是 C 代码中的相关部分。 Float32 sampleArray[256] = { // Array is 256 Float value
您可能知道,VLA's haves pros and cons 和它们在 C11 中是可选的。 我想使 VLA 成为可选项的主要原因是:“堆栈可能会爆炸”: int arr[n]; /* where
这段代码有什么错误?为什么我不能按照我尝试的方式取消引用该元素。 #include typedef struct { int value; struct node * left;
有什么方法可以在 JavaScript 中创建\返回指向变量的指针吗? 比如,在 PHP 中: function func() { ..... return &$result; } 我
如果您想使用方法的指针作为参数,则需要将该方法键入作为对象的函数,就像这样好 : type TAcceptor = function(filename:string):boolean of objec
很简单的问题: 我对 C++ 中的智能指针有点陌生。我想我得到了所有权的东西,但我不知道如何访问他们实际指向的内容。当我尝试使用对象的成员函数/变量时,我只是得到了 unique_ptr 类的函数,这
我得到了一个点的方位 Angular 、指南针方向和一个可以将箭头设置到某个方向的 api(0 是顶部,90 是右侧,180 是底部,360 是顶部) 如果我希望箭头指向我采用方位 Angular 形
我正在尝试找到一种方法,从单元格中获取位于当前工作表左侧(托盘下方)的工作表单元格中的数据。 我知道如何通过调用其他工作表 =Sheet1!A1 但现在我需要一些最好的解释 =Sheet[-1]!A1
所以我在 MATLAB 中有一个 for 循环,其中向量 x 将通过一个函数,比如 cos(x).^2,或者不同的选择,比如 sin(x).^2 + 9.*x。用户将在 for 循环之前选择他想使用的
我是一名优秀的程序员,十分优秀!