cuda - 2D 纹理的间距对齐-6ren

cuda - 2D 纹理的间距对齐

转载作者：行者123 更新时间：2023-12-04 18:11:39

29

4

2D 纹理是 CUDA 在图像处理应用中的一个有用特性。要将音高线性内存绑定(bind)到 2D 纹理，内存必须对齐。 cudaMallocPitch是对齐内存分配的好选择。在我的设备上，cudaMallocPitch 返回的音高是 512 的倍数，即内存是 512 字节对齐的。

设备的实际对齐要求由 cudaDeviceProp::texturePitchAlignment 确定在我的设备上是 32 个字节。

我的问题是:

如果 2D 纹理的实际对齐要求是 32 字节，那么 cudaMallocPitch返回 512 字节对齐的内存？

这不是浪费内存吗？例如，如果我创建一个大小为 513 x 100 的 8 位图像，它将占用 1024 x 100 字节。

我在以下系统上得到这种行为:

1:华硕 G53JW + Windows 8 x64 + GeForce GTX 460M + CUDA 5 + Core i7 740QM + 4GB RAM

2:戴尔 Inspiron N5110 + Windows 7 x64 + GeForce GT525M + CUDA 4.2 + Corei7 2630QM + 6GB RAM

最佳答案

这是一个略微推测的答案，但请记住，分配的间距必须满足纹理的两个对齐属性，一个用于纹理指针，一个用于纹理行。我怀疑 cudaMallocPitch尊重前者，由 cudaDeviceProp::textureAlignment 定义.例如:

#include <cstdio>

int main(void)
{
    const int ncases = 12;
    const size_t widths[ncases] = { 5, 10, 20, 50, 70, 90, 100,
        200, 500, 700, 900, 1000 };
    const size_t height = 10;

    float *vals[ncases];
    size_t pitches[ncases];

    struct cudaDeviceProp p;
    cudaGetDeviceProperties(&p, 0);
    fprintf(stdout, "Texture alignment = %zd bytes\n",
            p.textureAlignment);
    cudaSetDevice(0);
    cudaFree(0); // establish context

    for(int i=0; i<ncases; i++) {
        cudaMallocPitch((void **)&vals[i], &pitches[i], 
            widths[i], height);
        fprintf(stdout, "width = %zd <=> pitch = %zd \n",
                widths[i], pitches[i]);
    }

    return 0;
}

在 GT320M 上给出以下信息:

Texture alignment = 256 bytes
width = 5 <=> pitch = 256 
width = 10 <=> pitch = 256 
width = 20 <=> pitch = 256 
width = 50 <=> pitch = 256 
width = 70 <=> pitch = 256 
width = 90 <=> pitch = 256 
width = 100 <=> pitch = 256 
width = 200 <=> pitch = 256 
width = 500 <=> pitch = 512 
width = 700 <=> pitch = 768 
width = 900 <=> pitch = 1024 
width = 1000 <=> pitch = 1024

我猜 cudaDeviceProp::texturePitchAlignment适用于 CUDA 阵列。

关于cuda - 2D 纹理的间距对齐，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12550927/

29

4

0

文章推荐： f# - 数据库连接和 F#

文章推荐： edi - EDI 处理工作原理概述

具有多个显示上下文的 OpenGL 纹理
我有一个未定义数量的显示上下文，每个都将显示一个纹理。当我调用 glGenTextures 时，我会在所有显示上下文中返回相同的名称。这会起作用吗？即使它们具有相同的名称，它们仍会存储和显示不同的纹理
css - 在物理文本上使用背景图像/纹理？
我在 SVG 中看到过:文本填充是图像而不是颜色；我一直想知道使用 CSS3 是否可以实现这样的事情。我浏览了整个网络，到目前为止只找到了基本上将图像覆盖在文本上的解决方法(请参阅 this ，这对
Webgl:销毁或重用缓冲区/纹理？
我是 WebGL 的新手。 :)我知道顶点数据和纹理不应该经常更新，但是当它们确实发生变化时，首选哪个:- 通过调用 gl.deleteBuffer 销毁先前的缓冲区 (static_draw) 并创
iPhone， float 纹理
我需要将 GL_RGBA32F 作为内部格式，但我在 OpenGL ES 实现中没有得到它。相反，我只得到 GL_FLOAT 作为纹理数据类型。 OES_texture_float 规范没有说明里面的
javascript - Threejs 纹理
当我执行某些几何体的渲染时，我可以在控制台中看到此警告: THREE.WebGLRenderer: Texture is not power of two. Texture.minFilter sho
javascript - 无法渲染到帧缓冲区(纹理)
我正在尝试使用阴影贴图实现阴影，因此我需要将场景渲染到单独的帧缓冲区(纹理)。我无法让它正常工作，因此在剥离我的代码库后，我留下了一组相对简单的指令，这些指令应该将场景渲染到纹理，然后简单地渲染纹理。
XNA .Fbx 纹理
我在 XNA 中使用带有自定义着色器的标准 .fbx 导入器。当我使用 BasicEffect 时，.fbx 模型被 UV 正确包裹并且纹理正确。但是，当我使用我的自定义效果时，我必须将纹理作为参数加
android - Libgdx - 纹理
如果我创建一个 .PNG 1024 x 1024 的纹理并在中间画一个 124 x 124 的圆，它周围是空的，它使用的 RAM 量是否与我画一个 124 x 的圆一样124 x 124 空间上的 1
android - 纹理/顶点的不同索引数组
我试图在 Android 中绘制一个地球仪，为此我使用了 OpenGL。然而，为了让它更容易理解，我将从制作一个简单的 3D 立方体开始。我使用 Blender 创建我的 3D 对象(立方体)，并在我
javascript - 文本的前景图像/纹理
文本本身的背景图像层是否有任何 JS/CSS 解决方案？示例最佳答案检查这个http://lea.verou.me/2012/05/text-masking-the-standards-way/
Swift SpriteKit 纹理
非功能代码: if sprite.texture == "texture" { (code) } 当 Sprite 具有特定纹理时，我正在尝试访问 Sprite 的纹理以运行代码。目前纹理仅在我的
ios - SceneKit 纹理
我正在尝试学习适用于 iOS 的 SceneKit 并超越基本形状。我对纹理的工作原理有点困惑。在示例项目中，平面是一个网格，并对其应用了平面 png 纹理。你如何“告诉”纹理如何包裹到物体上？在 3
three.js - 无法克隆()纹理
基本上，这有效: var expl1 = new THREE.ImageUtils.loadTexture( 'images/explodes/expl1.png' ); this.material
opengl - 如何从帧缓冲区取消绑定(bind)纹理
我正在尝试将各种场景渲染为一组纹理，每个场景都有自己的纹理到应该绘制的位置...... 问题: 创建 512 个 FBO，每个 FBO 绑定(bind)了 512 个纹理，这有多糟糕。只使用一个 FB
configuration - 纹理 protobuf 中的评论？
我正在使用文本 protobuf 文件进行系统配置。我遇到的一个问题是序列化的 protobuf 格式不支持注释。有没有办法解决？我说的是文本序列化数据格式，而不是方案定义。这个问题是有人在某
opengl - 计算着色器不修改 3d 纹理
我想将我的 3D 纹理的初始化从 CPU 移到 GPU。作为测试，我编写了一个着色器将所有体素设置为一个常数值，但纹理根本没有修改。我如何使它工作？计算着色器: #version 430 layou
java - 如何创建 JavaFX 纹理
我可以像这样用 JavFX 制作一个矩形: Rectangle node2 = RectangleBuilder.create() .x(-100) .
iPhone OpenGLES 纹理 - 色带
我在 iPhone 上遇到了 openGL 问题，我确信一定有一个简单的解决方案! 当我加载纹理并显示它时，我得到了很多我认为所谓的“色带”，其中颜色，特别是渐变上的颜色，似乎会自动“优化”。只是为
caching - GORM(纹理)-缓存Blob图片或其他内容
假设我有一个域类 class Profile{ String name byte[] logo } 和一个 Controller : class ImageController {
c++ - 缓存 OpenGL 纹理
我正在开发一款使用 SDL 的 2D 游戏。由于某些系统的 CPU 较弱而 GPU 较强，因此除了普通的 SDL/软件之外，我还有一个使用 OpenGL 的渲染器后端。渲染器界面的简化版本如下所示:

首页

博学

6Ren·AI

商城

cuda - 2D 纹理的间距对齐