gpt4 book ai didi

cuda - cudaAddressModeBorder 是否适用于非标准化坐标?

转载 作者:行者123 更新时间:2023-12-04 04:40:57 25 4
gpt4 key购买 nike

我正在使用纹理对象来访问 PGM 图像像素。我的愿望是让纹理获取给定坐标中的像素值,如果超出边界,则为 0。

这是我的纹理描述:

unsigned char *device_input=NULL;
size_t input_pitch;
checkCudaErrors(cudaMallocPitch(&device_input, &input_pitch, sizeof(unsigned char)*IMAGE_WIDTH, IMAGE_HEIGHT));
checkCudaErrors(cudaMemcpy2D(device_input, input_pitch, image, sizeof(unsigned char)*IMAGE_WIDTH, sizeof(unsigned char)*IMAGE_WIDTH, IMAGE_HEIGHT, cudaMemcpyHostToDevice));

cudaResourceDesc resDesc;
memset(&resDesc, 0, sizeof(resDesc));
resDesc.resType = cudaResourceTypePitch2D;
resDesc.res.pitch2D.devPtr = device_input; //
resDesc.res.pitch2D.pitchInBytes = input_pitch;
resDesc.res.pitch2D.width = IMAGE_WIDTH;
resDesc.res.pitch2D.height = IMAGE_HEIGHT;
resDesc.res.pitch2D.desc = cudaCreateChannelDesc<unsigned char>();

cudaTextureDesc texDesc;
memset(&texDesc, 0, sizeof(texDesc));
texDesc.readMode = cudaReadModeElementType;
texDesc.normalizedCoords=false;
texDesc.addressMode[0]=cudaAddressModeBorder;
texDesc.addressMode[1]=cudaAddressModeBorder;

cudaTextureObject_t tex;
cudaCreateTextureObject(&tex, &resDesc, &texDesc, NULL);

但是,在我的内核中:
tex2D<unsigned char>(tex_inputImage,-100,-100)

这显然在图像的边界之外返回图像 [0,0] 处的值而不是值 0。

同样适用于:
tex2D<unsigned char>(tex_inputImage,IMAGE_WIDTH+1,IMAGE_HEIGHT+1)

返回 image[IMAGE_WIDTH,IMAGE_HEIGHT] 处的值而不是 0。

请注意,通过使用标准化坐标,cudaAddressModeBorder 按预期工作,但我不想使用标准化坐标。根据 nvidia 的编程指南 ( Here ),非标准化坐标支持 cudaAddressModeBorder。

我做错了什么吗?

最佳答案

这是我自己的问题的答案:

该程序在驱动程序版本为 319.32 的机器上运行,显然该驱动程序存在处理 cudaAddressModeBorder 的错误。喜欢 cudaAddressModeClamp使用法线坐标 ( More on the problem here - check the last couple of replies ) 时。

该错误已在版本 319.49 和 cudaAddressModeBorder 中修复使用归一化和非归一化坐标按预期工作。

关于cuda - cudaAddressModeBorder 是否适用于非标准化坐标?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18922191/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com