Android三重缓冲-预期行为？-6ren

Android三重缓冲-预期行为？

转载作者：塔克拉玛干更新时间：2023-11-02 08:33:13

我正在研究应用程序的性能，因为我注意到它在滚动时会掉落一些帧。我运行了systrace(在运行4.3的Nexus 4上)，并在输出中注意到了interesting section。

起初一切都很好。 Zooming in on the left section，我们可以看到绘图在每个vsync上开始，以剩余的时间结束，并等到下一个vsync为止。由于它是三重缓冲的，因此应将其绘制到一个缓冲区中，然后在完成后将其发布到以下vsync上。

在放大的屏幕快照中的第4个vsync上，该应用程序执行了一些工作，并且下一个vsync的绘制操作无法及时完成。但是，我们不会丢弃任何帧，因为先前的抽奖正在前面进行。

但是，在这种情况发生之后，绘制操作不会弥补丢失的vsync。相反，每个vsync仅启动一个绘制操作，现在它们不再向前绘制一帧。

Zooming in on the right section，应用程序完成了更多工作，并且错过了另一个vsync。由于我们没有在前面画一个框架，因此实际上在这里放置了一个框架。此后，它可以回到前面绘制一帧。

这是预期的行为吗？我的理解是，如果您错过了vsync，则三重缓冲可以使您恢复，但是这种行为看起来像是您错过的每两个vsync都会丢掉一帧。

跟进问题

在this screenshot的右侧，应用程序渲染缓冲区的速度实际上比显示器消耗缓冲区的速度快。假设在PerformTraversals＃1(在屏幕快照中标记)期间，正在显示缓冲区A，并且正在渲染缓冲区B。＃1在vsync之前完成很长时间，并将缓冲区B放入队列中。此时，应用程序是否应该能够立即开始渲染缓冲区C？相反，performTraversals＃2直到下一个vsync才开始，这浪费了之间的宝贵时间。

同样，对于waitForever on the left side here的需求我也有些困惑。假设正在显示缓冲区A，正在队列B中，正在渲染缓冲区C。缓冲区C完成渲染后，为什么不立即将其添加到队列中？相反，它会执行waitForever直到从队列中删除缓冲区B，然后才添加缓冲区C，这就是为什么无论应用程序渲染缓冲区的速度如何，队列似乎始终保持在大小1。

最佳答案

仅当您保持缓冲区已满时，才提供缓冲的数量。这意味着渲染速度快于显示器消耗它们的速度。

标签没有出现在图像中，但是我猜测绿色vsync行上方的紫色行是BufferQueue状态。您可以看到它通常随时都有0或1个完整的缓冲区。在“左侧放大”图像的最左侧，您可以看到它有两个缓冲区，但是之后只有一个，在屏幕的3/4处，您会看到一个很短的紫色条，表示它几乎没有及时渲染帧。

有关背景，请参见this post和this post。

更新以解决所添加的问题...

the other post中的细节几乎没有爬取表面。我们必须更深入。

systrace中显示的BufferQueue计数是排队的缓冲区的数量，即其中包含内容的缓冲区的数量。当SurfaceFlinger抓取要显示的缓冲区时，它将立即释放该缓冲区，并将其状态更改为“空闲”。当缓冲区显示在叠加层上时，这特别令人兴奋，因为显示是直接从缓冲区渲染的(与合成暂存缓冲区并显示相反)。

我再说一遍:显示器正在主动从中读取数据以在屏幕上显示的缓冲区在BufferQueue中被标记为“空闲”。缓冲区具有关联的围栅，该围栅最初是“Activity 的”。处于 Activity 状态时，不允许任何人修改缓冲区内容。当显示器不再需要缓冲区时，它将向篱笆发出信号。

因此，跟踪左侧的代码位于waitForever()中的原因是因为它正在等待栅栏发出信号。当VSYNC命中时，显示切换到另一个缓冲区，向围墙发出信号，您的应用程序可以立即开始使用该缓冲区。这样可以消除因必须等待SurfaceFlinger唤醒，不再使用缓冲区，通过BufferQueue发送IPC释放缓冲区等而导致的等待时间。

请注意，仅当您不落后时(对跟踪的左侧和右侧)，才会显示对waitForever()的调用。当队列只有1个完整的缓冲区时，我不确定为什么会发生这种情况-应该使最早的缓冲区出队，该缓冲区应该已经发出信号了。

最重要的是，您将永远不会看到BufferQueue在三重缓冲之上超过两个。

并非所有设备都如上所述工作。 Nexus 7(2012)并未使用“显式同步”机制，并且ICS之前的设备完全没有BufferQueues。

回到编号的屏幕截图，是的，在“1”和“2”之间有足够的时间可以让您的应用运行performTraversals()。很难肯定地说不知道您的应用程序在做什么，但是我想您已经有了一个由Choreographer驱动的动画周期，该周期会唤醒每个VSYNC并起作用。它没有比这更频繁地运行。

如果您使用systrace Android Breakout，则可以尽可能快地进行渲染(“队列填充”)，并依靠BufferQueue背压来调节游戏速度，从而看到它的外观。

比较运行4.3的N4和运行4.4的N4尤其有趣。在4.3上，跟踪与您相似，队列在1处徘徊，规则降为0，在2处偶尔出现尖峰。在4.4上，队列几乎总是在2处，偶尔下降到1。睡在eglSwapBuffers();在4.3中，跟踪通常显示在其下方的waitForever()，而在4.4中，其显示dequeueBuffer()。 (我不知道产生这种意外原因的原因。)

更新2: 4.3和4.4之间存在差异的原因似乎是Nexus 4驱动程序的更改。 4.3驱动程序使用了旧的dequeueBuffer调用，该调用变成了dequeueBuffer_DEPRECATED()(Surface.cpp line 112)。旧的接口(interface)不会将fence作为“输出”参数，因此调用必须调用waitForever()本身。较新的接口(interface)只是将篱笆返回给GL驱动程序，GL驱动程序会在需要时进行等待(可能不会立即执行)。

更新3: here现在可以使用甚至更长的解释。

关于Android三重缓冲-预期行为？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23377564/

文章推荐： android - 滑动以删除自定义 View 而不是列表项

文章推荐： Java JDK - 为 macOS 下载时出现 404

文章推荐： android - 比较android中的两种声音

node.js - Chrome 的跟踪事件分析工具中的自上而下(树)、自上而下(重)和自下而上(重)有什么区别
我正在尝试使用谷歌浏览器的 Trace Event Profiling Tool分析我正在运行的 Node.js 应用程序。选择点样本后，我可以在三种 View 之间进行选择: 自上而下(树) 自上而
android - 重 ContentProvider 查询和 ListView
对于一个可能是菜鸟的问题，我们深表歉意，但尽管在 SO 上研究了大量教程和其他问题，但仍找不到答案。我想做的很简单:显示一个包含大量数据库存储字符串的 Android ListView。我所说的“很
css - 基础 5 div 重
我已经开始了一个新元素的工作，并决定给 Foundation 5 一个 bash，看看它是什么样的。在创建带有水平字段的表单时，我在文档中注意到的第一件事是它们使用大量 div 来设置样式。所以我在下
.net - 重 CPU 负载下的跨线程 BeginInvoke 阻塞
我有一个 Windows 窗体用户控件，其中包含一个使用 BeginInvoke 委托(delegate)调用从单独线程更新的第 3 方图像显示控件。在繁重的 CPU 负载下，UI 会锁定。当我附加
javascript - 什么是测试 Dom 重 js 的好方法？
我有一堆严重依赖dom元素的JS代码。我目前使用的测试解决方案依赖于 Selenium ，但 AFAIK 无法正确评估 js 错误(addScript 错误不会导致您的测试失败，而 getEval 会
Java Swing 重/慢 paintComponent - 有什么建议吗？
我正在制作一款基于滚动 2D map /图 block 的游戏。每个图 block (存储为图 block [21][11] - 每个 map 总共 231 个图 block )最多可以包含 21 个
javascript - 在网页上 - 如何显示(轻)图像并在客户端下载后者时将其替换为(重)图像？
考虑到以下情况，我是前端初学者: 某个 HTML 页面应该包含一个沉重的图像(例如 - 动画 gif)，但我不想强制客户缓慢地等待它完全下载才能享受一个漂亮的页面，而是我更愿意给他看一个轻量级图像(例
python - 重 I/O 和 python 多处理/多线程
我正在设计一个小软件，其中包括: 在互联网上获取资源，一些用户交互(资源的快速编辑)，一些处理。我想使用许多资源(它们都列在列表中)来这样做。每个都独立于其他。由于编辑部分很累，我想让用户(可能
c# - 重 I/O 操作中的 Parallel.ForEach 与异步 For 循环
我想比较两个理论场景。为了问题的目的，我简化了案例。但基本上它是您典型的生产者消费者场景。 (我关注的是消费者)。我有一个很大的Queue dataQueue我必须将其传输给多个客户端。那么让我们
python - K 重 CV 的变体，其中 size(test_set) > N/K
我有一个二元分类问题，标签 0 和 1(少数)存在巨大不平衡。由于测试集带有标签 1 的行太少，因此我将训练测试设置为至少 70-30 或 60-40，因此仍然有重要的观察结果。由于我没有过多地衡量准

塔克拉玛干

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

Android三重缓冲-预期行为？