c++ - 为什么建议使用多个像素缓冲区对象。肯定是多余的？-6ren

c++ - 为什么建议使用多个像素缓冲区对象。肯定是多余的？

转载作者：可可西里更新时间：2023-11-01 17:59:06

26

4

This当有人询问 OpenGL 中的视频流纹理时，通常会引用这篇文章。

它说:

To maximize the streaming transfer performance, you may use multiple pixel buffer objects. The diagram shows that 2 PBOs are used simultaneously; glTexSubImage2D() copies the pixel data from a PBO while the texture source is being written to the other PBO.

For nth frame, PBO 1 is used for glTexSubImage2D() and PBO 2 is used to get new texture source. For n+1th frame, 2 pixel buffers are switching the roles and continue to update the texture. Because of asynchronous DMA transfer, the update and copy processes can be performed simultaneously. CPU updates the texture source to a PBO while GPU copies texture from the other PBO.

它们提供了一个简单的基准测试程序，允许您在不使用 PBO、使用单个 PBO 和使用两个 PBO 的纹理更新之间循环，如上所述。

启用一个 PBO 后，我发现性能略有提高。但是第二个 PBO 没有真正的区别。

就在代码 glMapBuffer 的 PBO 之前，它调用 glBufferData 并将指针设置为 NULL。它这样做是为了避免同步停顿。

// map the buffer object into client's memory
// Note that glMapBufferARB() causes sync issue.
// If GPU is working with this buffer, glMapBufferARB() will wait(stall)
// for GPU to finish its job. To avoid waiting (stall), you can call
// first glBufferDataARB() with NULL pointer before glMapBufferARB().
// If you do that, the previous data in PBO will be discarded and
// glMapBufferARB() returns a new allocated pointer immediately
// even if GPU is still working with the previous data.

所以，这是我的问题......这不是让第二个 PBO 完全没用了吗？只是浪费内存!？

对于两个 PBO，纹理数据存储了 3 次。纹理中有 1 个，每个 PBO 中有一个。

只有一个 PBO。数据有两个拷贝。在 glMapBuffer 创建新缓冲区的情况下暂时只有第三个，因为现有缓冲区目前正在 DMA 到纹理？

这些评论似乎表明 OpenGL 驱动程序内部能够创建第二个缓冲区 IF，并且仅在需要时才创建，以避免停止管道。正在使用的缓冲区正在被 DMA 处理，我对 map 的调用产生了一个新的缓冲区供我写入。

那篇文章的作者似乎在这方面比我自己更了解。我是否完全误解了这一点？

最佳答案

回答我自己的问题...但我不会接受它作为答案...(目前)。

问题中链接的基准程序有很多问题。它使用即时模式。它使用过剩!

该程序大部分时间都在做我们对分析不感兴趣的事情。主要是通过 GLUT 渲染文本，并在纹理上写出漂亮的条纹。所以我删除了这些功能。

我将纹理结果提高到 8K，并添加了更多PBO 模式。

无 PBO(产生 6fps)
1 个公益组织。孤立以前的缓冲区。 (产生 12.2 fps)。
2 个 PBO。 Orpha 先前的缓冲区。 (产生 12.2 fps)。
1 个公益组织。不要孤立以前的 PBO(可能的停顿 - 由我自己添加。产生 12.4 fps)。
2 个 PBO。不要孤立以前的 PBO(可能的停顿 - 由我自己添加。产生 12.4 fps)。

如果其他人想检查我的代码，可以使用 here

我尝试了不同的纹理大小...和不同的 updatePixels 函数...尽管我尽了最大的努力，但我无法使双 PBO 实现比单 PBO 实现更好。

此外...不孤立以前的缓冲区，实际上会产生更好的性能。与文章声称的完全相反。

也许现代驱动程序/硬件不会遇到此设计试图修复的问题......

也许我的图形硬件/驱动程序有问题，没有利用双 PBO...

也许经常引用的文章是完全错误的？

谁知道呢。 . . .我的测试硬件是 Intel(R) HD Graphics 5500 (Broadwell GT2)。

关于c++ - 为什么建议使用多个像素缓冲区对象。肯定是多余的？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50605653/

26

4

0

文章推荐： c++ - 模板推导与隐式用户定义转换运算符

文章推荐： c++ - 从 io_context 中删除工作或使用多个 io_context 对象

文章推荐： c++ - 保留的函数名可以重载吗？

.NET 开发人员开始社交网站，建议？
我是一个相对较新的程序员； CS 学士学位，大学毕业大约 2 年，主要使用 C# 中的 .NET。我对 SQL 交互/脚本编写相当流利，并且对 ASP.NET 做了一些工作(主要是维护现有站点)。我
opencv - 动态视频流分析 - 建议？
我计划开发一个简单的解决方案，使我能够即时执行非常基本的视频流分析。我以前从未做过类似的事情，因此这是一个非常笼统和开放的问题。主要重点是检查流是否正常运行，例如 - 卡住帧、黑屏以及音频是否存在。同
关于大型项目的版本控制和避免包含表达式的版本的 Maven 建议
我正在考虑重组一个大型 Maven 项目...... 我们当前结构的基本概述: build [MVN plugins, third party dependency management]:5.1
sql - 查询调优 - 建议
我需要有关附加查询的建议。该查询执行了一个多小时，并根据解释计划进行了全表扫描。我对查询调优还很陌生，希望得到一些建议。首先，为什么我要进行全表扫描，即使我使用的所有列都在其上创建了索引。其次，有
mysql - 一个疯狂的数据库结构 - 建议
我正在做一个项目，我需要在 4 个模型之间创建三个多对多关系。这是它的过程: 常见问题类别可以有许多常见问题子类别，反之亦然。常见问题组可以有许多常见问题的子类别，反之亦然。常见问题可以有许多常见
embedded - 小型嵌入式合成语音库/建议
对于代码大小比语音质量更重要的 PIC 和/或 ARM 嵌入式系统，是否有任何易于使用的免费或廉价的语音合成库？现在似乎 1 meg 的封装被认为是“紧凑的”，但很多微 Controller 都比它小
具有多个有效负载的 Solr 建议
我们正在使用 Solr 建议器功能进行 businessName 查找。当用户输入查询以及匹配的名称时，我们希望 solr 发送来自个人资料的其他属性，如 id、地址、城市、州、国家等字段。我尝试使
Delphi:建议，构建用户界面的想法
我正在构建一个用户界面。我的计划将包括 4 个主要部分: 1) 顶部菜单 - TMainMenu。一个窗口的顶部 2) 主菜单 - TTreeView。一个窗口的左边。 TreeView的每一项=对应
sharepoint - 需要技术推荐/建议
我的公司需要一个任务管理系统来处理从“为X购买一台计算机”到“将一个人转移到另一个国家”这样简单的场景。简单的场景是由一个人处理的单个任务，而更大的任务可以分解为在工作流程中委派给多个人的多个子任务。
marklogic - 内存使用规划 - 建议？
MarkLogic 服务器的林大小与实际内存的建议比率是多少？例如，我目前有一个 190GB 的数据库，并且该数据库随着时间的推移而不断增长。由于数据库会不断增长，我最终需要对该数据库进行集群。因此，
audio - 关于如何解码数据包的线索，建议
去年我收到了一个礼物，它是一个索尼 CMT700Ni 音频站，支持 wifi。它还具有类似于广播的功能，称为“PartyStreaming”。我目前正在挖掘内部，探索它，所以也许我可以结束拥有自己的“
nlp - 如何选择特征选择算法？ - 建议
有没有我可以阅读的研究论文/书籍可以告诉我针对手头的问题哪种特征选择算法最有效。我试图简单地将 Twitter 消息识别为 pos/neg(首先)。我从基于频率的特征选择开始(从 NLTK 书开始)
.net - 需要技术推荐/建议
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，
java - jUnit - 建议
我正在浏览 stackoverflow 以查找有关使用 jUnit 进行测试的常见建议，但仍然有几个问题。我知道，如果要测试的方法很复杂，最好的方法是将其分成小的单独部分并测试每个部分。但问题是 -
Java Collection 建议
我有一个方法如下 public List> categorize(List customClass){ List> returnValue = new ArrayList<>();
svn - 需要关于使用分支和合并回主干的帮助/建议
我的问题是，当按照下面的程序合并时，在最佳实践场景中，“将分支折叠回主干”程序的最后一步是正确的方法吗？我已经使用 svn 很多年了。在我的个人项目中，我总是毫不犹豫地在主干上愉快地进行修改，并且在
iphone - UINavigationController 建议
我读过 UINavigationController当您想从 n 个屏幕跳转到第一个屏幕时，这是最佳选择。这样做需要以下代码: NSMutableArray *array=[[NSMutableArr
java - 文件输入帮助/建议
我有一个文件输入类。它在构造函数中有一个字符串参数来加载提供的文件名。但是，如果文件不存在，它就会退出。如果文件不存在，我希望它输出一条消息 - 但不确定如何...... 这是类(class): pu
flash - 交互式世界地图 - 建议？
我希望创建一个“您访问过的国家/地区” map - 就像您可能在 Facebook、TravelAdvisor 和诸如此类的网站上看到的那样。我尝试过不同的闪光灯套件，但它们并不像我希望的那样先进。
Perl 建议 - 接收文件并更改内容
我需要一些关于如何处理我想用 Perl 编写的脚本的建议。基本上我有一个看起来像这样的文件: id: 1 Relationship: "" name: shelby pet: 1

首页

博学

6Ren·AI

商城

c++ - 为什么建议使用多个像素缓冲区对象。肯定是多余的？