opengl - 使用 MSAA 订购独立透明度-6ren

opengl - 使用 MSAA 订购独立透明度

转载作者：行者123 更新时间：2023-12-04 02:54:33

我已经根据《OpenGL 编程指南》第 8 版(红皮书)中的演示实现了 OIT。现在我需要添加 MSAA。只要启用 MSAA 就搞砸了透明度，因为分层像素被解析 x 次等于样本级别的数量。我已阅读 this关于如何使用 DirectX 完成的文章，他们说像素着色器应该按样本而不是按像素运行。它是如何在 OpenGL 中完成的。

我不会在这里列出整个实现，而是在其中出现分层像素的最终分辨率的片段着色器 block :

vec4 final_color = vec4(0,0,0,0);
for (i = 0; i < fragment_count; i++)
{
    /// Retrieving the next fragment from the stack:
    vec4 modulator = unpackUnorm4x8(fragment_list[i].y) ;
    /// Perform alpha blending:
    final_color =   mix(final_color, modulator, modulator.a);
}

color = final_color ;

更新:

我已经尝试了这里提出的解决方案，但它仍然不起作用。这是列表构建和解析过程的完整片段着色器:

列表构建过程:

#version 420 core
layout (early_fragment_tests) in;
layout (binding = 0, r32ui) uniform uimage2D head_pointer_image;
layout (binding = 1, rgba32ui) uniform writeonly uimageBuffer list_buffer;
layout (binding = 0, offset = 0) uniform atomic_uint list_counter;
layout (location = 0) out vec4 color;//dummy output

in vec3 frag_position;
in vec3 frag_normal;
in vec4 surface_color;
in int gl_SampleMaskIn[];
uniform vec3 light_position = vec3(40.0, 20.0, 100.0);

void main(void)
{
    uint index;
    uint old_head;
    uvec4 item;
    vec4 frag_color;
    index = atomicCounterIncrement(list_counter);
    old_head = imageAtomicExchange(head_pointer_image, ivec2(gl_FragCoord.xy), uint(index));

    vec4 modulator =surface_color;
    item.x = old_head;
    item.y = packUnorm4x8(modulator);
    item.z = floatBitsToUint(gl_FragCoord.z);
    item.w = int(gl_SampleMaskIn[0]);
    imageStore(list_buffer, int(index), item);
    frag_color = modulator;
    color = frag_color;
}

列表解析:

#version 420 core
// The per-pixel image containing the head pointers
layout (binding = 0, r32ui) uniform uimage2D head_pointer_image;
// Buffer containing linked lists of fragments
layout (binding = 1, rgba32ui) uniform uimageBuffer list_buffer;
// This is the output color
layout (location = 0) out vec4 color;
// This is the maximum number of overlapping fragments allowed
#define MAX_FRAGMENTS 40

// Temporary array used for sorting fragments
uvec4 fragment_list[MAX_FRAGMENTS];

void main(void)
{
    uint current_index;
    uint fragment_count = 0;
    current_index = imageLoad(head_pointer_image, ivec2(gl_FragCoord).xy).x;

    while (current_index != 0 && fragment_count < MAX_FRAGMENTS )
    {   
        uvec4 fragment = imageLoad(list_buffer, int(current_index));
        int coverage = int(fragment.w);
        //if((coverage &(1 << gl_SampleID))!=0) {

            fragment_list[fragment_count] = fragment;
            current_index = fragment.x;

        //}

        fragment_count++;
    }

    uint i, j;

    if (fragment_count > 1)
    {
        for (i = 0; i < fragment_count - 1; i++)
        {
            for (j = i + 1; j < fragment_count; j++)
            {
                uvec4 fragment1 = fragment_list[i];
                uvec4 fragment2 = fragment_list[j];

                float depth1 = uintBitsToFloat(fragment1.z);
                float depth2 = uintBitsToFloat(fragment2.z);

                if (depth1 < depth2)
                {
                    fragment_list[i] = fragment2;
                    fragment_list[j] = fragment1;
                }
            }
        }
    }

    vec4 final_color = vec4(0,0,0,0);

    for (i = 0; i < fragment_count; i++)
    {  
        vec4 modulator = unpackUnorm4x8(fragment_list[i].y);
        final_color =  mix(final_color, modulator, modulator.a);      
    }

    color = final_color;
}

最佳答案

在不知道您的代码实际如何工作的情况下，您可以按照与链接的 DX11 演示非常相似的方式进行操作，因为 OpenGL 提供了所需的相同功能。

因此，在仅存储所有渲染片段的第一个着色器中，您还存储了每个片段的样本覆盖 mask (当然还有颜色和深度)。这是作为片段着色器输入变量 int gl_SampleMaskIn[] 给出的，对于每个具有 id 32*i+j 的样本，位 j 的 glSampleMaskIn[i] 如果片段覆盖了该样本(因为您可能不会使用 >32xMSAA，您通常可以只使用 glSampleMaskIn[0] 并且只需要存储一个单个 int 作为覆盖掩码)。

...
fragment.color = inColor;
fragment.depth = gl_FragCoord.z;
fragment.coverage = gl_SampleMaskIn[0];
...

然后为每个样本运行最终的排序和渲染着色器，而不仅仅是为每个片段运行。这是通过使用输入变量 int gl_SampleID 隐式实现的，它为我们提供了当前样本的 ID。所以我们在这个着色器中(除了非 MSAA 版本之外)所做的是排序步骤只考虑样本，如果当前样本实际被覆盖，则只将一个片段添加到最终(待排序的)片段列表通过这个片段:

类似的东西(注意，从您的小片段和 DX 链接推断出的伪代码):

while(fragment.next != 0xFFFFFFFF)
{
    fragment_list[count++] = vec2(fragment.depth, fragment.color);
    fragment = fragments[fragment.next];
}

现在

while(fragment.next != 0xFFFFFFFF)
{
    if(fragment.coverage & (1 << gl_SampleID))
        fragment_list[count++] = vec2(fragment.depth, fragment.color);
    fragment = fragments[fragment.next];
}

或者类似的东西。

编辑:对于更新后的代码，您必须仅在 if(covered) block 内增加 fragment_count，因为我们不这样做如果样本未被覆盖，想将片段添加到列表中。始终增加它可能会导致您在边缘看到伪影，这些区域是 MSAA(以及覆盖范围)发挥作用的区域。

另一方面，必须在每次循环迭代中转发列表指针 (current_index = fragment.x)，而且不仅是在样本被覆盖的情况下，否则会导致无限循环，就像你的情况一样。所以你的代码应该是这样的:

while (current_index != 0 && fragment_count < MAX_FRAGMENTS )
{
    uvec4 fragment = imageLoad(list_buffer, int(current_index));
    uint coverage = fragment.w;
    if((coverage &(1 << gl_SampleID))!=0)
        fragment_list[fragment_count++] = fragment;
    current_index = fragment.x;
}

关于opengl - 使用 MSAA 订购独立透明度，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16934695/

文章推荐： printing - 打印 pdf 时边框变细

文章推荐： vb6 - 将大字节数组转换为长数组会抛出溢出异常

文章推荐： python - 如何使 QPushButton 成为加载按钮？

opengl - OpenGL/OpenGLES 中的帧缓冲区纹理行为
在 OpenGL/ES 中，在实现渲染到纹理功能时，您必须小心，不要引起反馈循环(从正在写入的同一纹理中读取像素)。由于显而易见的原因，当您读取和写入纹理的相同像素时，行为是未定义的。但是，如果您正在
opengl - OpenGL 3、OpenGL 4 实现中的已知错误
正如我们最终都知道的那样，规范是一回事，实现是另一回事。大多数错误是我们自己造成的，但有时情况并非如此。我相信列出以下内容会很有用: GPU 驱动程序中当前已知的与最新版本的 OpenGL 和 GL
opengl - 如何在 OpenGL ES/OpenGL 中创建透明玻璃杯？
很难说出这里问的是什么。这个问题是模棱两可的、模糊的、不完整的、过于宽泛的或修辞的，无法以目前的形式得到合理的回答。为了帮助澄清这个问题以便可以重新打开它，visit the help center
opengl - 我想知道如何实现 OpenGL 驱动程序来学习 opengl 内部结构？
我正在学习 OpenGL，非常想知道与显卡的交互如何。我觉得了解它是如何在图形驱动程序中实现的，会让我了解 opengl 的完整内部结构(通过这个我可以知道哪些阶段/因素影响我对 opengl 性能
opengl - 大于窗口大小的渲染缓冲区 - OpenGL
我正在尝试绘制到大于屏幕尺寸(即 320x480)的渲染缓冲区 (512x512)。执行 glReadPixels 后，图像看起来是正确的，除非图像的尺寸超过屏幕尺寸——在本例中，超过 320 水平
opengl - OpenGL 中的背景图像
我正在 Windows 中制作一个 3D 小行星游戏(使用 OpenGL 和 GLUT)，您可以在其中穿过一堆障碍物在太空中移动并生存下来。我正在寻找一种方法来针对无聊的 bg 颜色选项设置图像背景。
opengl - OpenGL 纹理的纵横比会影响性能吗？
如果我想要一个包含 100 个 10*10 像素 Sprite 的 Sprite 表，是否可以将它们全部排成一排来制作 1,000*10 像素纹理？还是 GPU 对不那么窄的纹理表现更好？这对性能有什
opengl - OpenGL 中的广告牌效果
这个问题在这里已经有了答案: Rendering 2D sprites in a 3D world? (7 个答案) 关闭 6 年前。我如何概念化让图像始终面对相机。我尝试将三角函数与 arcta
opengl - 我如何增加缓冲区 OpenGL？
是否可以在 OpenGL 中增加缓冲区？假设我想使用实例化渲染。每次在世界上生成一个新对象时，我都必须用实例化数据更新缓冲区。在这种情况下，我有一个 3 个 float 的缓冲区 std::v
opengl - OpenGL 中的多边形
有人可以向我解释为什么下面的代码没有绘制任何东西，但如果我使用 GL_LINE_LOOP 它确实形成了一个闭环吗？ glBegin(GL_POLYGON); for(int i = 0; i <= N
opengl - opengl 中的渲染目标是什么？
正如标题所说，OpenGL 中的渲染目标是什么？我对 OpenGL 很陌生，我看到的所有网站都让我很困惑。它只是一个缓冲区，我在其中放置稍后将用于渲染的东西吗？如果您能提供一个很好的引用来阅读它，
opengl - OpenGL 是否钳制每个纹理阶段的输出？
当使用 OpenGL 1.4 固定功能多纹理时，每个纹理阶段的输出在传递到下一个阶段之前是否都固定在 [0, 1]？ spec说(第 153 页): If the value of TEXTURE_E
opengl - openGL ES和OpenGL函数的区别
我比较了 2 个函数 openGL ES 和 openGL gvec4 texelFetchOffset(gsampler2DArray sampler, ivec3 P, int lod, ivec
opengl - OpenGL 中的门户效果
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 10 年前。 Improve thi
opengl - OpenGL 绘图库
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 6年前关闭。 Improve this qu
opengl - opengl 函数会导致主线程卡住吗？
那么当你调用opengl函数时，比如glDraw或者gLBufferData，是否会导致程序线程停止等待GL完成调用呢？如果不是，那么 GL 如何处理调用像 glDraw 这样的重要函数，然后立即更
opengl - OpenGL 上的级联阴影贴图纹理访问错误
我正在尝试实现级联阴影贴图，当我想访问我的视锥体的每个分区的相应深度纹理时，我遇到了一个错误。更具体地说，当我想选择正确的阴影纹理时会出现我的问题，如果我尝试下面的代码，我会得到一个像 this 中
opengl - OpenGL ES和OpenGL兼容的着色器
我想为OpenGL ES和OpenGL(Windows)使用相同的着色器源。为此，我想定义自定义数据类型并仅使用OpenGL ES函数。一种方法是定义: #define highp #define
opengl - OpenGL 中的立方体映射
我尝试用 6 个位图映射立方体以实现天空盒效果。我的问题是一个纹理映射到立方体的每个面。我已经检查了 gDEBugger，在立方体纹理内存中我只有一个图像(因为我尝试加载六个图像)。代码准备纹理:
opengl - OpenGL 中的深度偏移
在 OpenGL 中偏移深度的最佳方法是什么？我目前每个多边形都有索引顶点属性，我将其传递给 OpenGL 中的顶点着色器。我的目标是在深度上偏移多边形，其中最高索引始终位于较低索引的前面。我目前有这

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

opengl - 使用 MSAA 订购独立透明度