glsl - 使用 Vulkan 在片段着色器中缓慢获取纹理-6ren

glsl - 使用 Vulkan 在片段着色器中缓慢获取纹理

转载作者：行者123 更新时间：2023-12-05 00:55:04

25

4

我正在做一个内核大小为 64 的 SSAO 着色器。

SSAO 片段着色器:

const int kernelSize = 64;
for (int i = 0; i < kernelSize; i++) {
        //Get sample position
        vec3 s = tbn * ubo.kernel[i].xyz;
        s = s * radius + origin;
        vec4 offset = vec4(s, 1.0);
        offset = ubo.projection * offset;
        offset.xy /= offset.w;
        offset.xy = offset.xy * 0.5 + 0.5;
        float sampleDepth = texture(samplerposition, offset.xy).z;
        float rangeCheck = abs(origin.z - sampleDepth) < radius ? 1.0 : 0.0;
        occlusion += (sampleDepth >= s.z ? 1.0 : 0.0) * rangeCheck;
    }

采样位置纹理的格式为 VK_FORMAT_R16G16B16A16_SFLOAT并上传标志 VK_MEMORY_PROPERTY_DEVICE_LOCAL_BIT .

我使用的是带有 nvidia K1100M 显卡的笔记本电脑。如果我在 renderdoc 中运行代码，这个着色器需要 114 毫秒 .如果我更改 kernelSize到 1，需要 1 毫秒 .

这个纹理获取时间正常吗？或者可能是我在某处设置了错误？

好像没有经过布局过渡，所以纹理在 VK_IMAGE_LAYOUT_COLOR_ATTACHMENT_OPTIMAL而不是 VK_IMAGE_LAYOUT_SHADER_READ_ONLY_OPTIMAL .

最佳答案

GPU 内存依赖于大量缓存使用，如果彼此靠近的片段不采样彼此相邻的纹素，则这是非常有限的 - 也称为缺乏空间一致性。我预计随机访问纹理与线性一致访问相比，速度会降低 10 倍或更多。当使用大半径时，SSAO 很容易出现这种情况。

我建议使用较小的半径并优化纹理访问。您正在采样 4 个 16 位浮点数，但您只使用了一个。将深度分解为单独的 16 位深度图像应该可以轻松实现 4 倍加速。

关于glsl - 使用 Vulkan 在片段着色器中缓慢获取纹理，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38953632/

25

4

0

文章推荐： elixir - 使用速记符号匿名函数将元组转换为列表

文章推荐： dart - 有没有办法在 Dart 程序中找到冗余代码和变量？

文章推荐： ScalaCheck:Gen.choose 输出超出指定范围的值

glsl - GLSL 中不变和精确的关键字
我试图理解这两个概念。我正在阅读的手册对它们非常简短，像多 channel 算法这样的东西对我来说是新的。我想要一些示例(不是代码)，说明我需要在哪里使用不变变量或精确变量，只是为了获得一个大致的想法
glsl - glsl 中的带边框圆角矩形
您好，我正在尝试获得一个快速的圆角矩形 glsl 着色器，但我只设法使用此函数( https://github.com/marklundin/glsl-sdf-primitives/blob/mast
glsl - [GLSL]如何比较世界坐标中所有顶点的z值？
这可能是一个简单的问题。作为 GLSL 的新手，我宁愿在这里问。现在，在顶点着色器中，我可以通过以下方式获取世界坐标系中的位置: gl_Position = ftransform();
glsl - GLSL 中的高效双三次过滤代码？
我想知道是否有人拥有完整、有效且高效的代码来在 glsl 中进行双三次纹理过滤。有这个: http://www.codeproject.com/Articles/236394/Bi-Cubic-and
glsl - GLSL 和 GLSL ES 2 之间的差异
真的有两个问题... GLSL ES 2 是完全独立的语言，还是 GLSL 的特殊版本？在“标准库”函数、语法和功能方面，它们之间有什么区别？我正在为一个针对 Windows、Mac 和 iPad
glsl - GLSL-长度函数
从GLSL文档(https://www.khronos.org/registry/OpenGL-Refpages/gl4/html/length.xhtml)中，长度函数“计算 vector 的长度”
glsl - 如何在 GLSL 着色器中实现颜色矩阵过滤器
我想在 GLSL 着色器中实现颜色矩阵滤镜，但找不到与此相关的任何文档。我是着色器世界的新手(我自己从未编写过代码)所以如果我的解释/词汇没有意义，请原谅我。到目前为止我可以收集到的信息: 一个颜色
glsl - 如何在 GLSL 片段着色器中获得相对于法线的视角？
我刚刚开始使用 openframeworks 中的着色器，并且正在尝试编写一个片段着色器，它根据片段的观看角度来更改片段的颜色。例如，给定一个矩形，如果从正面看(相机与法线平行)它会是红色，但如果从侧
glsl - GLSL sign() 函数是否会导致分支以及它是如何工作的？
似乎某些在 case 中具有输出的函数可能使用 if 语句作为底层实现，从而导致分支。我不认为它，但我想知道。对于 sign(x)，如果数字是正数、负数或零，则分别重新运行 1、-1 和 0。那么
glsl - 如何在 glsl 中执行位操作
如何在 glsl 中执行位操作？使用常规 C 风格的按位运算符 | , & , ^ , 或 !不起作用。最佳答案它们是在 GLSL 1.30 (OGL 3.0) 中引入的。根据您想要做什么，您
glsl - 使用 GLSL 着色器从图像生成高度图
最近我一直在玩 webGl，我偶然发现了一个很酷的小演示 here (来源 here )我想稍微改变一下以获得一些很酷的结果。我对改变地形的生成方式很感兴趣。而不是分层 10 个 Octave
glsl - WebGL 使用什么版本的 GLSL
这是每个设备的事情吗？还是基于浏览器？抱歉问了这样一个基本问题，但我似乎找不到直接的答案。最佳答案它基于 OpenGL ES 2.0，并根据 the spec , 它必须支持 GLSL ES 版本
glsl - 您可以在 GLSL 着色器中通过引用传递矩阵吗？
你如何在 GLSL 着色器中通过引用传递？最佳答案您可以将属性标记为 inout在函数签名中，这将使属性有效地“通过引用传递” 例如， void doSomething( vec3 trans,
glsl - Vulkan GLSL 的统一纹素缓冲区
我有一个浮点 RGBA 缓冲区，我想将其作为统一 Texel 缓冲区传递到我的计算着色器(用于只读访问，没有采样)。谁能告诉我如何在 GLSL 中执行此操作？我能找到的所有示例似乎都在跳过该主题，或
glsl - GLSL ES 中的统一与属性
我有一些参数从 CPU 传递到 GPU，这些参数对于所有片段都是恒定的，但在每一帧上都会发生变化(我使用的是 GLSL ES 1.1)。对于这些值，我应该使用制服还是属性？属性可能因顶点而异，所以我的
glsl - GLSL rand() 这一行代码的起源是什么？
我已经看到这个伪随机数生成器在着色器中使用，引用here and there around the web : float rand(vec2 co){ return fract(sin(dot(
glsl - 如何在 GLSL 结构体中初始化数组
我尝试在结构内初始化数组，如下所示: struct myStruct { vec3 data[20] = vec3[20] (vec3(1, 1, 1), vec3( 1, -1, 1), v
glsl - 如何在 GLSL 结构体中初始化数组
我尝试在结构内初始化数组，如下所示: struct myStruct { vec3 data[20] = vec3[20] (vec3(1, 1, 1), vec3( 1, -1, 1), v
glsl - 在 GLSL 中传递值的最快方法是什么？
在 GLSL 着色器中，出于各种原因，我经常需要几个函数来修改单个值(例如，片段着色器使用四个函数来应用照明、纹理、镜面反射和雾化)。我可以想到至少三种方法来传递这些值进行修改: 使用 inout每个
glsl - 如何在 GLSL 中复制数组？
我在 SL 引用中搜索了“copy”，但找不到任何相关内容。如果我有: float a[3] = float[3] (1.0,2.0,3.0); float b[3] = a; 是 b现在指向 a

首页

博学

6Ren·AI

商城

glsl - 使用 Vulkan 在片段着色器中缓慢获取纹理