- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想使用纹理 2D 内存来实现 double 。我想从纹理读取到共享内存并将 int2 转换为 double,然后传输回主机内存但我只根据需要获取第一行,所有其他行的值为 2.00000000。
#include<stdio.h>
#include<cuda.h>
#define Xdim 8
#define Ydim 8
texture<int2,2>me_texture;
static __inline__ __device__ double fetch_double(int2 p){
return __hiloint2double(p.y, p.x);
}
__global__ void kern(double *o, int pitch){
__shared__ double A[Xdim][Ydim];
unsigned int i = blockIdx.x*blockDim.x + threadIdx.x;
unsigned int j = blockIdx.y*blockDim.y + threadIdx.y;
int2 jj;
if(i<Xdim && j<Ydim){
jj = tex2D(me_texture, i, j);
A[threadIdx.x][threadIdx.y] = fetch_double(jj);
}
__syncthreads();
if(i<Xdim && j<Ydim){
o[j*Xdim + i] = A[threadIdx.x][threadIdx.y];
}
}
int main(int argc, char *argv[]){
double hbuf[Xdim][Ydim];
double hout[Xdim][Ydim];
double *dob;
double *dbuf;
size_t pitch_bytes;
cudaMallocPitch((void**)&dbuf, &pitch_bytes, sizeof(double)*Xdim, Ydim);
cudaMallocPitch((void**)&dob, &pitch_bytes, sizeof(double)*Xdim, Ydim);
hbuf[0][0] = 1.234567891234567;
hbuf[0][1] = 12.34567891234567;
hbuf[0][2] = 123.4567891234567;
hbuf[0][3] = 1234.567891234567;
hbuf[0][4] = 12345.67891234567;
hbuf[0][5] = 123456.7891234567;
hbuf[0][6] = 1234567.891234567;
hbuf[0][7] = 12345678.91234567;
hbuf[1][0] = 123456789.1234567;
hbuf[1][1] = 1234567891.234567;
hbuf[1][2] = 12345678912.34567;
hbuf[1][3] = 123456789123.4567;
hbuf[1][4] = 1234567891234.567;
hbuf[1][5] = 12345678912345.67;
hbuf[1][6] = 123456789123456.7;
hbuf[1][7] = 1234567891234567;
hbuf[2][0] = 123456789.7654321;
hbuf[2][1] = 1234567897.654321;
hbuf[2][2] = 12345678976.54321;
hbuf[2][3] = 123456789765.4321;
hbuf[2][4] = 1234567897654.321;
hbuf[2][5] = 12345678976543.21;
hbuf[2][6] = 123456789765432.1;
hbuf[2][7] = 1234567897654321;
hbuf[3][0] = 9.876543211234567;
hbuf[3][1] = 98.76543211234567;
hbuf[3][2] = 987.6543211234567;
hbuf[3][3] = 9876.543211234567;
hbuf[3][4] = 98765.43211234567;
hbuf[3][5] = 987654.3211234567;
hbuf[3][6] = 9876543.211234567;
hbuf[3][7] = 98765432.11234567;
hbuf[4][0] = 987654321.1234567;
hbuf[4][1] = 9876543211.234567;
hbuf[4][2] = 98765432112.34567;
hbuf[4][3] = 987654321123.4567;
hbuf[4][4] = 9876543211234.567;
hbuf[4][5] = 98765432112345.67;
hbuf[4][6] = 987654321123456.7;
hbuf[4][7] = 9876543211234567;
hbuf[5][0] = 987654321.7654321;
hbuf[5][1] = 9876543217.654321;
hbuf[5][2] = 98765432176.54321;
hbuf[5][3] = 987654321765.4321;
hbuf[5][4] = 9876543217654.321;
hbuf[5][5] = 98765432176543.21;
hbuf[5][6] = 987654321765432.1;
hbuf[5][7] = 9876543217654321;
hbuf[6][0] = 1234567891234567;
hbuf[6][1] = 123456789123456.7;
hbuf[6][2] = 12345678912345.67;
hbuf[6][3] = 1234567891234.567;
hbuf[6][4] = 123456789123.4567;
hbuf[6][5] = 12345678912.34567;
hbuf[6][6] = 1234567891.234567;
hbuf[6][7] = 123456789.1234567;
hbuf[7][0] = 12345678.91234567;
hbuf[7][1] = 1234567.891234567;
hbuf[7][2] = 123456.7891234567;
hbuf[7][3] = 12345.67891234567;
hbuf[7][4] = 1234.567891234567;
hbuf[7][5] = 123.4567891234567;
hbuf[7][6] = 12.34567891234567;
hbuf[7][7] = 1.234567891234567;
for (int i=0; i<Xdim; i++){
for(int j=0; j<Ydim; j++){
printf("%.16f\t", hbuf[i][j]);
}
printf("\n");
}
cudaMemcpy2D(dbuf, pitch_bytes, hbuf, Xdim*sizeof(double), Xdim*sizeof(double), Ydim, cudaMemcpyHostToDevice);
me_texture.addressMode[0] = cudaAddressModeClamp;
me_texture.addressMode[1] = cudaAddressModeClamp;
me_texture.filterMode = cudaFilterModeLinear;
me_texture.normalized = false;
cudaBindTexture2D(0, me_texture, dbuf, cudaCreateChannelDesc(32,32,0,0, cudaChannelFormatKindSigned), Xdim, Ydim, pitch_bytes );
int pitch = pitch_bytes/sizeof(double);
kern<<<1, 64>>>(dob, pitch);
cudaMemcpy2D(hout,Xdim*sizeof(double), dob, pitch_bytes, Xdim*sizeof(double),Ydim, cudaMemcpyDeviceToHost);
printf("\nI am Fine\n");
for(int i = 0 ; i < Xdim ; i++){
for(int j=0; j<Ydim; j++){
printf("%.16f\t", hout[i][j]);
}
printf("\n");
}
cudaUnbindTexture(me_texture);
cudaFree(dbuf);
cudaFree(dob);
return 0;
}
最佳答案
如果您更改以下内容,上面的代码可以正常工作。替换
kern<<<1, 64>>>(..., ..)
到
dim3 blockPerGrid(1, 1)
dim3 threadPerBlock(8, 8)
kern<<<blockPerGrid, threadPerBlock>>>(....)
此处将 Xdim 更改为 pitch
o[j*pitch + i] = A[threadIdx.x][threadIdx.y];
并将 cudaFilterModeLinear 更改为 cudaFilterModePoint 。编译时需要指定计算能力,假设你的计算能力是3.0,那么就是
nvcc -arch=sm_30 file.cu
关于CUDA C - 如何使用Texture2D实现 double 浮点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33739373/
我创建了一个类来保存我的模型信息。我必须正确渲染模型并正确包裹纹理,但出于某种原因,如果我有多个模型,它会将我的所有模型纹理化为仅 1 个纹理,如您在此图像中所见:http://imgur.com/d
是否有可能,如果有,如何在 OpenGL4.x 中的不同 channel 上创建和读取具有不同压缩算法的 RGBA 纹理: 没有实际意义的例子A: RG channel 存储以 3Dc 编码的法线贴图
我需要将浮点数据提供给计算着色器。 我看到的 3 种方法是: 着色器存储缓冲区对象 缓冲纹理 “经典”纹理(使用 PBO 将数据上传到 GPU,然后使用 glTexSubImage2D 将数据复制到纹
我会保持简单:本文末尾列出的代码在我的项目中按从上到下的顺序排列。我有一个 OGLES2.0 框架,可以完美渲染除纹理之外的所有内容。渲染单个纹理时,我看到的只是一个尺寸正确的黑盒子。 这是我已验证的
我在 Android 平台上编码。我正在尝试为三角形使用纹理(从 Assets 文件夹加载图像)。当我的应用程序运行时,它只是三角形中的空白白色(不是我想要的纹理)。 我读过一些其他资料,说图像必须是
我有道路的纹理。具有此纹理的线(由三角形条表示)如下所示: 当然,道路可以与其他道路重叠。在这种情况下,我想隐藏道路边界。道路边界具有 alpha 0.6,同时道路具有 alpha 1。那么当它们与具
我正在画一个到 webgl Canvas 上。我可以在 Chrome 和 Firefox 中使用它,但 IE11 似乎会抛出错误。错误指出: drawElements: The texture is
我想使用自定义着色器将纹理渲染到平面上。这个纹理有一个“偏移”属性集,当我使用标准的 threejs Material 时它可以正常工作。但是,我不知道如何在我的自定义片段着色器中访问这些偏移量。它只
导入项目后,Unity 中不断出现此错误。 这是代码: public static void CameraFadeSwap(Texture2D texture){ if(cameraFade)
这就是我在片段着色器中渲染画笔的方式: gl_FragColor.rgb = Color.rgb; gl_FragColor.a = Texture.a * Color.a; 在 (0, 0, 0,
我目前正在尝试在 Android 上开发视频播放器,但在颜色格式方面遇到困难。 上下文:我通过 MediaExtractor/MediaCodec 的标准组合提取和解码视频。因为我需要将提取的帧用作
在 Xcode 13 beta 中运行模拟器,我遇到了崩溃,我该怎么办? _validateTextureView:557: failed assertion `Texture View Valida
在我目前制作的游戏中,我有两个着色器: 一个用于纹理图集上的 Sprite 一个单独加载的粒子形状纹理。 (我决定将此纹理保留在图集之外,因为我的生成器中的粒子是 GL_POINTS)。 目前,我将其
我正在创建两个渲染目标,两者都必须共享后台缓冲区的深度缓冲区,因此我将它们设置为具有相同的多重采样参数很重要,但是 pDevice->CreateTexture(..) 没有给出任何参数设置多重采样类
如何在 POV-Ray 中创建一个看起来像地球的球体?据推测,答案将涉及获取某种地球 map 并以某种方式将其包裹在球体周围作为纹理。谷歌搜索让我找到了http://www.physics.sfasu
是否可以从 中的纹理读取顶点带 WebGL 的着色器? 我写了一个 WebGL page (只是为了尝试一下)并使用 Chrome 7 对其进行测试。一旦我升级到 Chrome 8,它就停止工作。我仔
我正在为一个模型的多个网格渲染不同的纹理,但是我对程序没有太多的了解。有人建议为每个网格创建自己的描述符集,并调用vkCmdBindDescriptorSets()和vkCmdDrawIndexed(
我有一个简单的 Vulkan 设置,它加载了一个相当大的网格文件(女性)并应用了漫反射和法线贴图纹理。 顶点着色器: #version 450 core layout (set = 0, bindin
Apple 现在在其许多产品中都使用了这种纹理: 仔细看看: 您可以看到它不仅仅是一堆线条:它具有随机性元素。一般来说,如何才能做到这一点?我对实现不像对概念那么感兴趣。我在网上看过,但找不到任何提示
我知道这是一个非常常见的问题。我收到无法从未定义中读取属性“纹理”的消息。抱歉,我对 javascript 还很陌生。 我的代码的javascript部分如下 this.createTexture=f
我是一名优秀的程序员,十分优秀!