opengl - 优化最小/最大深度 GLSL 着色器-6ren

opengl - 优化最小/最大深度 GLSL 着色器

转载作者：行者123 更新时间：2023-12-01 03:48:38

27

4

我正在实现平铺延迟着色，为此我需要计算平铺的最小/最大深度值。我为每个图块渲染 1 个像素，并在嵌套的 for 循环中收集深度值，如下所示:

float minDepth = 1.0;
float maxDepth = 0.0;

ivec2 clampMax = ivec2(screenSize) - 1;

// Iterate over each pixel in this tile
for (int x = 0; x < 32; x++) {
    for (int y = 0; y < 32; y++) {
        ivec2 newCoord = screenCoord + ivec2(x,y);
        newCoord = min(newCoord, clampMax);

        // Fetch the depth for that coordinate
        float currentDepth = texelFetch(depth, newCoord, 0).r;

        minDepth = min(minDepth, currentDepth);
        maxDepth = max(maxDepth, currentDepth);
    }
}

到目前为止，这工作正常，但查看生成的程序集，纹理查找得到如下内容:

// R2.xy contains 'newCoord'
MOV.S R2.z, {0, 0, 0, 0}.x;
TXF.F R1.x, R2.xyzz, handle(D0.x), 2D;

这基本上等于:

vec3 coordinate;
coordinate.xy = newCoord;
coordinate.z = 0;
result = texelFetch(depth, coordinate);

所以它为纹理查找生成了一个额外的不必要的指令，在这样一个循环中总结了很多。我的猜测是，NVIDIA 在内部将 texelFetch 实现为

texelFetch(sampler2D sampler, ivec3 coord)

回到问题: 你会如何优化这个循环？

我在 Windows 上使用带有最新驱动程序的 GTX 670。

最佳答案

不要担心这些额外的步骤。它很可能在比单个全局内存访问 (texelFetch) 快 200 多倍的寄存器中完成。

但这里有一种优化问题而不是循环的方法:

一般来说，最高效的 GPU 程序是那些每个线程做尽可能少的工作，并且所有线程工作的总和与顺序算法所需的数量相同。

Opengls 的方法现在是计算 GPU 上自己线程中的每个像素。这在大多数情况下完全没问题，但在您的问题中，每个线程的工作量非常大(32*32*texelFetch)。

那么如何优化这个问题呢？

-> 减少每个线程的工作量

如何？

-> 平行归约 ( http://www.drdobbs.com/architecture-and-design/parallel-pattern-7-reduce/222000718 )

非正式说明:

你有你的 32x32 区域。

不是计算整个区域的最小值/最大值，而是分多个步骤进行。

-> 计算 2x2 块的最小值/最大值(每个区域 16x16 块)

-> 所以现在你的图像小了 4 倍

-> 做 5 次

-> 您现在拥有完整区域的最小值/最大值

关于opengl - 优化最小/最大深度 GLSL 着色器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24763812/

27

4

0

文章推荐： django - 更新后无法在 pycharm 3.4 中运行 django？

文章推荐： jquery - 过滤和分页

文章推荐： javascript - Pepper Robot 对话框如何执行 javascript 函数？

文章推荐： python - 如何使用python抓取aspx页面

glsl - GLSL 中不变和精确的关键字
我试图理解这两个概念。我正在阅读的手册对它们非常简短，像多 channel 算法这样的东西对我来说是新的。我想要一些示例(不是代码)，说明我需要在哪里使用不变变量或精确变量，只是为了获得一个大致的想法
glsl - glsl 中的带边框圆角矩形
您好，我正在尝试获得一个快速的圆角矩形 glsl 着色器，但我只设法使用此函数( https://github.com/marklundin/glsl-sdf-primitives/blob/mast
glsl - [GLSL]如何比较世界坐标中所有顶点的z值？
这可能是一个简单的问题。作为 GLSL 的新手，我宁愿在这里问。现在，在顶点着色器中，我可以通过以下方式获取世界坐标系中的位置: gl_Position = ftransform();
glsl - GLSL 中的高效双三次过滤代码？
我想知道是否有人拥有完整、有效且高效的代码来在 glsl 中进行双三次纹理过滤。有这个: http://www.codeproject.com/Articles/236394/Bi-Cubic-and
glsl - GLSL 和 GLSL ES 2 之间的差异
真的有两个问题... GLSL ES 2 是完全独立的语言，还是 GLSL 的特殊版本？在“标准库”函数、语法和功能方面，它们之间有什么区别？我正在为一个针对 Windows、Mac 和 iPad
glsl - GLSL-长度函数
从GLSL文档(https://www.khronos.org/registry/OpenGL-Refpages/gl4/html/length.xhtml)中，长度函数“计算 vector 的长度”
glsl - 如何在 GLSL 着色器中实现颜色矩阵过滤器
我想在 GLSL 着色器中实现颜色矩阵滤镜，但找不到与此相关的任何文档。我是着色器世界的新手(我自己从未编写过代码)所以如果我的解释/词汇没有意义，请原谅我。到目前为止我可以收集到的信息: 一个颜色
glsl - 如何在 GLSL 片段着色器中获得相对于法线的视角？
我刚刚开始使用 openframeworks 中的着色器，并且正在尝试编写一个片段着色器，它根据片段的观看角度来更改片段的颜色。例如，给定一个矩形，如果从正面看(相机与法线平行)它会是红色，但如果从侧
glsl - GLSL sign() 函数是否会导致分支以及它是如何工作的？
似乎某些在 case 中具有输出的函数可能使用 if 语句作为底层实现，从而导致分支。我不认为它，但我想知道。对于 sign(x)，如果数字是正数、负数或零，则分别重新运行 1、-1 和 0。那么
glsl - 如何在 glsl 中执行位操作
如何在 glsl 中执行位操作？使用常规 C 风格的按位运算符 | , & , ^ , 或 !不起作用。最佳答案它们是在 GLSL 1.30 (OGL 3.0) 中引入的。根据您想要做什么，您
glsl - 使用 GLSL 着色器从图像生成高度图
最近我一直在玩 webGl，我偶然发现了一个很酷的小演示 here (来源 here )我想稍微改变一下以获得一些很酷的结果。我对改变地形的生成方式很感兴趣。而不是分层 10 个 Octave
glsl - WebGL 使用什么版本的 GLSL
这是每个设备的事情吗？还是基于浏览器？抱歉问了这样一个基本问题，但我似乎找不到直接的答案。最佳答案它基于 OpenGL ES 2.0，并根据 the spec , 它必须支持 GLSL ES 版本
glsl - 您可以在 GLSL 着色器中通过引用传递矩阵吗？
你如何在 GLSL 着色器中通过引用传递？最佳答案您可以将属性标记为 inout在函数签名中，这将使属性有效地“通过引用传递” 例如， void doSomething( vec3 trans,
glsl - Vulkan GLSL 的统一纹素缓冲区
我有一个浮点 RGBA 缓冲区，我想将其作为统一 Texel 缓冲区传递到我的计算着色器(用于只读访问，没有采样)。谁能告诉我如何在 GLSL 中执行此操作？我能找到的所有示例似乎都在跳过该主题，或
glsl - GLSL ES 中的统一与属性
我有一些参数从 CPU 传递到 GPU，这些参数对于所有片段都是恒定的，但在每一帧上都会发生变化(我使用的是 GLSL ES 1.1)。对于这些值，我应该使用制服还是属性？属性可能因顶点而异，所以我的
glsl - GLSL rand() 这一行代码的起源是什么？
我已经看到这个伪随机数生成器在着色器中使用，引用here and there around the web : float rand(vec2 co){ return fract(sin(dot(
glsl - 如何在 GLSL 结构体中初始化数组
我尝试在结构内初始化数组，如下所示: struct myStruct { vec3 data[20] = vec3[20] (vec3(1, 1, 1), vec3( 1, -1, 1), v
glsl - 如何在 GLSL 结构体中初始化数组
我尝试在结构内初始化数组，如下所示: struct myStruct { vec3 data[20] = vec3[20] (vec3(1, 1, 1), vec3( 1, -1, 1), v
glsl - 在 GLSL 中传递值的最快方法是什么？
在 GLSL 着色器中，出于各种原因，我经常需要几个函数来修改单个值(例如，片段着色器使用四个函数来应用照明、纹理、镜面反射和雾化)。我可以想到至少三种方法来传递这些值进行修改: 使用 inout每个
glsl - 如何在 GLSL 中复制数组？
我在 SL 引用中搜索了“copy”，但找不到任何相关内容。如果我有: float a[3] = float[3] (1.0,2.0,3.0); float b[3] = a; 是 b现在指向 a

首页

博学

6Ren·AI

商城

opengl - 优化最小/最大深度 GLSL 着色器