performance - 什么时候VBO比 “simple” OpenGL原语(glBegin())快？-6ren

performance - 什么时候VBO比 “simple” OpenGL原语(glBegin())快？

转载作者：行者123 更新时间：2023-12-03 07:50:53

25

4

经过多年关于“顶点缓冲对象”(VBO)的了解，我终于决定尝试使用它们(我的东西通常对性能没有要求，显然...)

我将在下面描述我的实验，但总而言之，我发现“简单”直接模式(glBegin()/ glEnd())，顶点数组(CPU端)和VBO(GPU端)之间的性能无可区别。渲染模式。我试图了解这是为什么，在什么条件下我可以期望看到VBO大大超过其原始(双关语意)祖先。

实验详情

对于实验，我生成了一个包含大量点的(静态)3D高斯云。每个点都有与之关联的顶点和颜色信息。然后，我在连续的帧中围绕云旋转摄像机，这是一种“绕行”行为。同样，这些点是静态的，只有眼睛移动(通过gluLookAt())。数据在任何渲染之前生成一次，并存储在两个数组中以供渲染循环使用。

对于直接渲染，整个数据集将在单个glBegin()/ glEnd()块中渲染，并带有一个循环，该循环包含对glColor3fv()和glVertex3fv()的单个调用。

对于顶点数组和VBO渲染，整个数据集通过一次glDrawArrays()调用来渲染。

然后，我只需要在一个紧密的循环中运行一分钟左右，然后使用高性能计时器来测量平均FPS。

绩效结果##

如上所述，在台式机(XP x64、8GB RAM，512 MB Quadro 1700)和笔记本电脑(XP32、4GB ram，256 MB Quadro NVS 110)上，性能都是无法区分的。但是，它的确按预期的比例扩展了点数。显然，我也禁用了vsync。

笔记本电脑运行的特定结果(使用GL_POINTS渲染):

glBegin()/ glEnd():

1K点-> 603 FPS

10K点-> 401 FPS

100K点-> 97 FPS

1M pts-> 14 FPS

顶点阵列(CPU端):

1K点-> 603 FPS

10K点-> 402 FPS

100K点-> 97 FPS

1M pts-> 14 FPS

顶点缓冲区对象(GPU端):

1K点-> 604 FPS

10K点-> 399 FPS

100K点-> 95 FPS

1M pts-> 14 FPS

我使用GL_TRIANGLE_STRIP渲染了相同的数据，并且变得难以区分(尽管由于额外的光栅化而比预期的慢)。如果有人需要，我也可以张贴这些数字。
。

问题

有什么用？

我该怎么做才能实现VBO的预期性能提升？

我想念什么？

最佳答案

优化3D渲染有很多因素。
通常有四个瓶颈:

CPU(创建顶点，APU调用以及其他所有功能)

总线(CPU <-> GPU传输)

顶点(固定功能管线执行之上的顶点着色器)

像素(填充，片段着色器执行和裁剪)

您的测试给出了偏差的结果，因为您拥有大量的CPU(和总线)，同时最大化了顶点或像素的吞吐量。 VBO用于降低CPU(较少的api调用，与CPU DMA传输并行)。由于您不受CPU的限制，因此它们不会给您带来任何好处。这是优化101。例如在游戏中，CPU变得非常宝贵，因为它需要AI和物理等其他功能，而不仅仅是发出大量的api调用。显而易见，直接将顶点数据(例如3个float)写入内存指针比调用将3个float写入内存的函数要快得多-至少可以节省调用的周期。

关于performance - 什么时候VBO比 “simple” OpenGL原语(glBegin())快？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/430555/

25

4

0

文章推荐： .NET xml 文档 - 继承文档

文章推荐： groovy - 如何从 groovy 闭包中返回并停止执行？

文章推荐： .net - 确保在 WPF 中的 UI 线程上运行

opengl - OpenGL/OpenGLES 中的帧缓冲区纹理行为
在 OpenGL/ES 中，在实现渲染到纹理功能时，您必须小心，不要引起反馈循环(从正在写入的同一纹理中读取像素)。由于显而易见的原因，当您读取和写入纹理的相同像素时，行为是未定义的。但是，如果您正在
opengl - OpenGL 3、OpenGL 4 实现中的已知错误
正如我们最终都知道的那样，规范是一回事，实现是另一回事。大多数错误是我们自己造成的，但有时情况并非如此。我相信列出以下内容会很有用: GPU 驱动程序中当前已知的与最新版本的 OpenGL 和 GL
opengl - 如何在 OpenGL ES/OpenGL 中创建透明玻璃杯？
很难说出这里问的是什么。这个问题是模棱两可的、模糊的、不完整的、过于宽泛的或修辞的，无法以目前的形式得到合理的回答。为了帮助澄清这个问题以便可以重新打开它，visit the help center
opengl - 我想知道如何实现 OpenGL 驱动程序来学习 opengl 内部结构？
我正在学习 OpenGL，非常想知道与显卡的交互如何。我觉得了解它是如何在图形驱动程序中实现的，会让我了解 opengl 的完整内部结构(通过这个我可以知道哪些阶段/因素影响我对 opengl 性能
opengl - 大于窗口大小的渲染缓冲区 - OpenGL
我正在尝试绘制到大于屏幕尺寸(即 320x480)的渲染缓冲区 (512x512)。执行 glReadPixels 后，图像看起来是正确的，除非图像的尺寸超过屏幕尺寸——在本例中，超过 320 水平
opengl - OpenGL 中的背景图像
我正在 Windows 中制作一个 3D 小行星游戏(使用 OpenGL 和 GLUT)，您可以在其中穿过一堆障碍物在太空中移动并生存下来。我正在寻找一种方法来针对无聊的 bg 颜色选项设置图像背景。
opengl - OpenGL 纹理的纵横比会影响性能吗？
如果我想要一个包含 100 个 10*10 像素 Sprite 的 Sprite 表，是否可以将它们全部排成一排来制作 1,000*10 像素纹理？还是 GPU 对不那么窄的纹理表现更好？这对性能有什
opengl - OpenGL 中的广告牌效果
这个问题在这里已经有了答案: Rendering 2D sprites in a 3D world? (7 个答案) 关闭 6 年前。我如何概念化让图像始终面对相机。我尝试将三角函数与 arcta
opengl - 我如何增加缓冲区 OpenGL？
是否可以在 OpenGL 中增加缓冲区？假设我想使用实例化渲染。每次在世界上生成一个新对象时，我都必须用实例化数据更新缓冲区。在这种情况下，我有一个 3 个 float 的缓冲区 std::v
opengl - OpenGL 中的多边形
有人可以向我解释为什么下面的代码没有绘制任何东西，但如果我使用 GL_LINE_LOOP 它确实形成了一个闭环吗？ glBegin(GL_POLYGON); for(int i = 0; i <= N
opengl - opengl 中的渲染目标是什么？
正如标题所说，OpenGL 中的渲染目标是什么？我对 OpenGL 很陌生，我看到的所有网站都让我很困惑。它只是一个缓冲区，我在其中放置稍后将用于渲染的东西吗？如果您能提供一个很好的引用来阅读它，
opengl - OpenGL 是否钳制每个纹理阶段的输出？
当使用 OpenGL 1.4 固定功能多纹理时，每个纹理阶段的输出在传递到下一个阶段之前是否都固定在 [0, 1]？ spec说(第 153 页): If the value of TEXTURE_E
opengl - openGL ES和OpenGL函数的区别
我比较了 2 个函数 openGL ES 和 openGL gvec4 texelFetchOffset(gsampler2DArray sampler, ivec3 P, int lod, ivec
opengl - OpenGL 中的门户效果
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 10 年前。 Improve thi
opengl - OpenGL 绘图库
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 6年前关闭。 Improve this qu
opengl - opengl 函数会导致主线程卡住吗？
那么当你调用opengl函数时，比如glDraw或者gLBufferData，是否会导致程序线程停止等待GL完成调用呢？如果不是，那么 GL 如何处理调用像 glDraw 这样的重要函数，然后立即更
opengl - OpenGL 上的级联阴影贴图纹理访问错误
我正在尝试实现级联阴影贴图，当我想访问我的视锥体的每个分区的相应深度纹理时，我遇到了一个错误。更具体地说，当我想选择正确的阴影纹理时会出现我的问题，如果我尝试下面的代码，我会得到一个像 this 中
opengl - OpenGL ES和OpenGL兼容的着色器
我想为OpenGL ES和OpenGL(Windows)使用相同的着色器源。为此，我想定义自定义数据类型并仅使用OpenGL ES函数。一种方法是定义: #define highp #define
opengl - OpenGL 中的立方体映射
我尝试用 6 个位图映射立方体以实现天空盒效果。我的问题是一个纹理映射到立方体的每个面。我已经检查了 gDEBugger，在立方体纹理内存中我只有一个图像(因为我尝试加载六个图像)。代码准备纹理:
opengl - OpenGL 中的深度偏移
在 OpenGL 中偏移深度的最佳方法是什么？我目前每个多边形都有索引顶点属性，我将其传递给 OpenGL 中的顶点着色器。我的目标是在深度上偏移多边形，其中最高索引始终位于较低索引的前面。我目前有这

首页

博学

6Ren·AI

商城

performance - 什么时候VBO比 “simple” OpenGL原语(glBegin())快？