- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
使用 Nvidia GTX480 GPU 驱动程序版本 275.50 和 280.19 对图像进行重新采样,灰度值几乎没有变化。也许这是一个插值问题。除了 OpenCL 1.1 版本的实现之外,我无法确定新版本中发生了什么变化。仅使用 OpenCL 1.0 会导致灰度值发生同样微小的变化。
下面的代码在驱动程序版本 275.50 和 280.19 之间给出了不同的结果:
success oclInitImgData(struct _Image2d *image)
{
cl_image_format volume_format;
volume_format.image_channel_order = CL_R;
volume_format.image_channel_data_type = CL_UNORM_INT16;
size = len[0] * sizeof(unsigned short);
img_h = clCreateImage2D(Ocl._GPUContext, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,
&volume_format, len[0], len[1], size, data, &error);
resampledImg_h = clCreateBuffer(Ocl._GPUContext, CL_MEM_READ_WRITE, size, NULL, &error);
oclResampleImg(Ocl._GPUCommandQueue[posSet], Ocl._pGPUKernels[posSet][K_IMG_RESAMPLE], img_h, resampledImg_h , Size, PixelSize, mm_per_p, vm_h);
}
__kernel void resampleImage( __read_only image2d_t IN image, __global uint OUT *resampledImage)
{
//get resampled position
int2 posResampledImg = (int2)(get_global_id(0), get_global_id(1));
//get dimension of the image
int2 imageSize = get_image_dim(image);
//calulate image size in mm
float2 imageSizemm = convert_float2(imageSize)*imagePixelSize;
float2 posImg = (posResampledImgmm + (imageSizemm*0.5f));
float2 posImgnorm = posImg/imageSizemm;
int2 posImgpix = convert_int2(posImg/imagePixelSize);
uint sample = 0;
if(read_imageui(image, CLK_NORMALIZED_COORDS_FALSE | CLK_ADDRESS_CLAMP | CLK_FILTER_NEAREST, posImgpix).x == 1)
{
//get grey value and store it in the resampled image
sample = read_imagef(image, CLK_NORMALIZED_COORDS_TRUE | CLK_ADDRESS_CLAMP | CLK_FILTER_LINEAR, posImgnorm).x * 65535.0f;
}
resampledImg[posResampledImg.y*convert_int(imageSizeResampled.x)+posResampledImg.x] = sample;
}
最佳答案
要获得有用的结果,您应该:
(1) 了解 OpenCL 规范是否涵盖了行为差异。
(2) 如果是,创建一个测试用例来演示它
(3) 向 Nvidia 提交错误报告
(4) ???
(5)利润
除了步骤 1-5 之外,我不知道这里的人可以如何帮助您。
关于driver - opencl 重采样中 GTX480 GPU 的 nvidia 驱动程序差异 275.50 和 280.19,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13030976/
Mac Big Sur C++ OpenGL 尝试从教程中学习四元数。gtx header 位于 usr/local/include/glm 下。任何人都可以找出我的标题包含或标题搜索路径有什么问题吗
我预计 GTX 680(最新版本的 GPU 之一)能够并发数据传输(双向并发数据传输)。但是当我运行cuda SDK“Device Query”时,“Concurrent copy and execu
我正在尝试实现简单的动态并行编程示例,例如.. __global__ ChildKernel(void* data){ //Operate on data } __global__ Paren
我在问以下问题,因为我很困惑...... 在各种网站和论文中,我发现有声明说 Kepler 架构增加了每个线程的寄存器数量,但在我的 GTX680 上,这似乎不是真的,因为 RegsPerBlock
当我尝试重叠数据传输和内核执行时,无论我使用什么流,卡似乎都按顺序执行所有内存传输。 所以,如果我发出以下命令: 流 1:MemcpyA_HtoD_1;内核_1; MemcpyA_DtoH_1 流 2
我有 GTX Titan Z 显卡。它有双 GPU,总内存为 12 GB(6GB + 6GB)。当我使用 Cuda Sample (V6.5) 文件夹中的 DeviceQuery 应用程序查看规范时,
我正在 OpenGL 中实现深度预传递。在 Intel HD Graphics 5500 上,此代码工作正常,但在 Nvidia GeForce GTX 980 上却没有(下图显示了产生的 z-fig
我有一个 Ubuntu 14.04 LTS 64 位,带有 Nvidia 显卡 - GTX 1070(第 10 代)。我正在尝试构建 TensorFlow。 我尝试使用 CUDA 7.5 和 CuDN
调用时 cudaError_t cuda_error; int device; cuda_error = cudaGetDevice(&device); assert(cudaSuccess == c
我在尝试追踪内存使用情况时遇到了 Geforce GTX 690 问题。一个简单的测试程序: BOOST_AUTO_TEST_CASE(cudaMemoryTest) { size_t mem_tot
我在编写一些 C++ AMP 代码时遇到了问题。我已经包含了一个样本。它在模拟加速器上运行良好,但在我的硬件(Windows 7、NVIDIA GeForce GTX 660、最新驱动程序)上使显示驱
我知道网格通过存储来工作,在我的实例中是 ListStore。如果我更改存储以重新加载/刷新数据,有没有办法可以调用网格? 最佳答案 试试这个: grid.getView().refresh(fals
我正在 GTX 980 ti 卡上尝试动态并行。所有运行代码的尝试都会返回“未知错误”。下面显示了带有编译选项的简单代码。 我可以毫无问题地在 depth=0 执行内核。第一次调用child时报错。c
我认为这可能是一个非常愚蠢的问题,但我对 OpenCL 还很陌生,只是让它在配备 GTX 760 GPU 的台式计算机上运行。 现在,当我查询 OpenCL 的 CL_DEVICE_MAX_COMPU
我正在尝试安装支持 CUDA 的 Tensorflow。这是我的规范: NVIDIA GTX 1070 CUDA 7.5 Cudnn v5.0 我已经通过 pip 安装安装了 Tensorflow -
我正在使用 tensorflow 训练 CNN 模型。我的 GPU 利用率仅达到 60% (+- 2-3%),没有大幅下降。 Sun Oct 23 11:34:26 2016 +-----
是否可以在 Windows 7 的 GTX590 上使用 Parallel Nsight 进行本地调试?我知道要进行本地调试,您需要两个 GPU。 590 有两个 GPU,但我无法让它工作。我收到错误
我一直在为我的计算机科学课制作游戏。为简单起见,我一直在制作一组迷你游戏。为了好玩,我尝试制作了经典贪吃蛇游戏的 3d 版本。物理和碰撞检测工作正常,并且在学校计算机(中等质量的 mac)上游戏运行非
我试图用 memcpyasync 重叠内核执行,但它不起作用。我遵循编程指南中的所有建议,使用固定内存、不同的流等。我看到内核执行确实重叠,但它没有与内存传输重叠。我知道我的卡只有一个复制引擎和一个执
我正在使用在 Windows 7 上运行的开源触觉和 3D 图形库 Chai3D。我已经重写了该库以使用 Nvidia nvision 进行立体 3D。我正在使用带有 GLUT 的 OpenGL,并使
我是一名优秀的程序员,十分优秀!