gpt4 book ai didi

c++ - GLSL/OpenGL 重用顶点着色器的输出

转载 作者:行者123 更新时间:2023-11-30 00:48:12 25 4
gpt4 key购买 nike

我在 3d 空间中渲染 Sprite ,其中每个四边形由两个三角形组成。我绘制 GL_TRIANGLES(见下文)。由于 2 个顶点在此构造中重复,因此顶点着色器执行两次相同的计算。

    5    3, 4
*---*
| /|
|/ |
*---*
1, 6 2

我想通过使用几何着色器重复这两个顶点来优化它。这样做的原因是顶点着色器很昂贵并且场景中有大量三角形。经过大量的 hackery,我设法实现了它。它关闭后效率非常低。它在我的机器上实际上慢了 45%。我假设这是因为原始装配执行了两次,并且在几何着色器中发生了很多不必要的数据复制。我无法查看汇编代码,所以我只能猜测。

现在我的问题是,是否有更好的方法可以比执行所有额外的顶点着色器操作更快。

最佳答案

不需要几何着色器。

您需要的是索引渲染:每个顶点仅在 VBO 中存储一次。然后,您创建额外的缓冲区对象(与 GL_ELEMENT_ARRAY_BUFFER 绑定(bind)),用于存储实际 VBO 中存储的顶点的索引

可视化:(来源:in2gpu.com)

enter image description here

请注意,在您的情况下, 还不错。例如,考虑画一个圆:比方说,您使用 360 度三角形绘制它(看起来很合理)。在这种情况下,每个三角形的中心顶点都会重复 - 这会导致 359 * 4(分量数 + 对齐方式)* 4(sizeof(float) 的通常值)= 5744 字节的不必要数据:

enter image description here

进一步阅读:


更新

Since 2 vertices are repeated in this formation, vertex shader does two times the same computation.

不,肯定不是。所有重复的顶点肯定会命中顶点缓存(我猜这就是你所说的“缓存”的意思?)并且将被重用。这是一种非常常见的使用模式 - 请记住,有时索引渲染不是解决方案(例如,当您对同一位置有不同的属性时 - 是的,您可以将位置数据移动到单独的 VBO,但通常不值得这样做,所以让我们离开),因此 GPU 必须有效地处理这种情况。 GPU 供应商负责解决这个问题。

所以不要优化它。如果您知道索引渲染,但您不能使用它或它没有提供任何改进,让 GPU 以尽可能最好的方式处理渲染。

关于c++ - GLSL/OpenGL 重用顶点着色器的输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32337658/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com