opengl-es - 在 OpenGL ES 中优化骨骼动画的顶点-6ren

opengl-es - 在 OpenGL ES 中优化骨骼动画的顶点

转载作者：行者123 更新时间：2023-12-04 21:46:53

31

4

所以我正在使用 2D 骨骼动画系统。

有 X 个骨骼，每个骨骼至少有 1 个部分(一个四边形，两个三角形)。平均而言，我可能有 20 块骨头和 30 个部分。大多数骨骼都依赖于父骨骼，骨骼会每帧移动。每个动画总共有多达 1000 帧，我使用了大约 50 个动画。任何时候在内存中总共加载了大约 50,000 帧。骨骼实例之间的零件不同。

我采用的第一种方法是计算每个骨骼的位置/旋转，并为每个部分构建一个顶点数组，其中包括:

[x1,y1,u1,v1],[x2,y2,u2,v2],[x3,y3,u3,v3],[x4,y4,u4,v4]

并将其传递给每帧 glDrawElements。

看起来不错，涵盖了我需要的所有场景，不占用太多内存，但表现得像条狗。在 iPod 4 上，渲染这些骨架中的 10 个可能会达到 15fps。

我发现大部分性能都被每帧复制如此多的顶点数据所消耗。我决定走向另一个极端，并“预先计算”动画，在开始时为每个角色建立一个顶点缓冲区，其中包含单个角色中每一帧、每一部分的 xyuv 坐标。然后，我计算应该在特定时间使用的帧的索引，并计算一个增量值，该值被传递到用于在当前帧和下一帧 XY 位置之间进行插值的着色器。

顶点看起来像这样，每帧

[--------------------- Frame 1 ---------------------],[------- Frame 2 ------]
[x1,y1,u1,v1,boneIndex],[x2, ...],[x3, ...],[x4, ...],[x1, ...][x2, ...][....]

顶点着色器如下所示:

attribute vec4 a_position;
attribute vec4 a_nextPosition;
attribute vec2 a_texCoords;
attribute float a_boneIndex;

uniform mat4 u_projectionViewMatrix;
uniform float u_boneAlpha[255];

varying vec2 v_texCoords;

void main() {
    float alpha = u_boneAlpha[int(a_boneIndex)];
    vec4 position = mix(a_position, a_nextPosition, alpha);
    gl_Position = u_projectionViewMatrix * position;
    v_texCoords = a_texCoords;  
}

现在，性能很棒，屏幕上有 10 个，它可以舒适地以 50fps 的速度运行。但是现在，它使用了大量的内存。我通过在 xyuv 上失去一些精度来优化它，现在是 ushorts。

还有一个问题是失去了骨骼依赖性。如果有两个骨骼，一个父子和一个子，并且子在 0s 和 2s 处有一个关键帧，父在 0s、0.5s、1.5s、2s 处有一个关键帧，那么子在 0.5s 和 2s 之间不会发生变化应该是 1.5 秒。

我想出了一个解决这个骨骼问题的解决方案——通过强制 child 在与 parent 相同的点上拥有关键帧。但这会占用更多内存，并且基本上杀死了骨骼层次结构的点。

这就是我现在所处的位置。我试图在性能和内存使用之间找到平衡。我知道这里有很多冗余信息(特定部分的所有帧的 UV 坐标都是相同的，因此重复约 30 次)。并且必须为每组零件创建一个新缓冲区(它们具有唯一的 XYUV 坐标——由于不同的零件尺寸不同，位置会发生变化)

现在我将尝试为每个字符设置一个顶点数组，其中包含所有部分的 xyuv，并计算每个部分的矩阵，并在着色器中重新定位它们。我知道这会起作用，但我担心性能不会比开始时为每一帧上传 XYUV 更好。

有没有更好的方法来做到这一点而不会失去我获得的性能？

有什么我可以尝试的疯狂想法吗？

最佳答案

更好的方法是即时转换您的 30 个零件，而不是在不同位置制作数千个零件的副本。您的顶点缓冲区将包含您的顶点数据的一份副本，从而节省大量内存。然后，每个帧都可以通过一组变换来表示，这些变换作为统一传递给顶点着色器，用于调用 glDrawElements() 绘制的每个骨骼。 .每个从属骨骼的变换都是相对于父骨骼构建的。然后，根据您想要动画的手工制作和程序生成之间的连续统一体的哪个位置，您的变换集可能会占用或多或少的空间和 CPU 计算时间。

Jason L. McKesson 的免费书籍，Learning Modern 3D Graphics Programming , 在第 6 章中很好地解释了如何完成此操作。本章末尾的示例程序显示了如何使用矩阵堆栈来实现分层模型。 I have an OpenGL ES 2.0 on iOS port of this program available .

关于opengl-es - 在 OpenGL ES 中优化骨骼动画的顶点，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13069809/

31

4

0

文章推荐： php - 什么时候在 Laravel 中使用 Repository vs Service vs Trait？

文章推荐： google-maps - 将 google.maps.Map 转换为静态 map 链接

文章推荐： sql - 如何在现有模式中查找 Informix DATETIME 字段限定符

opengl - OpenGL/OpenGLES 中的帧缓冲区纹理行为
在 OpenGL/ES 中，在实现渲染到纹理功能时，您必须小心，不要引起反馈循环(从正在写入的同一纹理中读取像素)。由于显而易见的原因，当您读取和写入纹理的相同像素时，行为是未定义的。但是，如果您正在
opengl - OpenGL 3、OpenGL 4 实现中的已知错误
正如我们最终都知道的那样，规范是一回事，实现是另一回事。大多数错误是我们自己造成的，但有时情况并非如此。我相信列出以下内容会很有用: GPU 驱动程序中当前已知的与最新版本的 OpenGL 和 GL
opengl - 如何在 OpenGL ES/OpenGL 中创建透明玻璃杯？
很难说出这里问的是什么。这个问题是模棱两可的、模糊的、不完整的、过于宽泛的或修辞的，无法以目前的形式得到合理的回答。为了帮助澄清这个问题以便可以重新打开它，visit the help center
opengl - 我想知道如何实现 OpenGL 驱动程序来学习 opengl 内部结构？
我正在学习 OpenGL，非常想知道与显卡的交互如何。我觉得了解它是如何在图形驱动程序中实现的，会让我了解 opengl 的完整内部结构(通过这个我可以知道哪些阶段/因素影响我对 opengl 性能
opengl - 大于窗口大小的渲染缓冲区 - OpenGL
我正在尝试绘制到大于屏幕尺寸(即 320x480)的渲染缓冲区 (512x512)。执行 glReadPixels 后，图像看起来是正确的，除非图像的尺寸超过屏幕尺寸——在本例中，超过 320 水平
opengl - OpenGL 中的背景图像
我正在 Windows 中制作一个 3D 小行星游戏(使用 OpenGL 和 GLUT)，您可以在其中穿过一堆障碍物在太空中移动并生存下来。我正在寻找一种方法来针对无聊的 bg 颜色选项设置图像背景。
opengl - OpenGL 纹理的纵横比会影响性能吗？
如果我想要一个包含 100 个 10*10 像素 Sprite 的 Sprite 表，是否可以将它们全部排成一排来制作 1,000*10 像素纹理？还是 GPU 对不那么窄的纹理表现更好？这对性能有什
opengl - OpenGL 中的广告牌效果
这个问题在这里已经有了答案: Rendering 2D sprites in a 3D world? (7 个答案) 关闭 6 年前。我如何概念化让图像始终面对相机。我尝试将三角函数与 arcta
opengl - 我如何增加缓冲区 OpenGL？
是否可以在 OpenGL 中增加缓冲区？假设我想使用实例化渲染。每次在世界上生成一个新对象时，我都必须用实例化数据更新缓冲区。在这种情况下，我有一个 3 个 float 的缓冲区 std::v
opengl - OpenGL 中的多边形
有人可以向我解释为什么下面的代码没有绘制任何东西，但如果我使用 GL_LINE_LOOP 它确实形成了一个闭环吗？ glBegin(GL_POLYGON); for(int i = 0; i <= N
opengl - opengl 中的渲染目标是什么？
正如标题所说，OpenGL 中的渲染目标是什么？我对 OpenGL 很陌生，我看到的所有网站都让我很困惑。它只是一个缓冲区，我在其中放置稍后将用于渲染的东西吗？如果您能提供一个很好的引用来阅读它，
opengl - OpenGL 是否钳制每个纹理阶段的输出？
当使用 OpenGL 1.4 固定功能多纹理时，每个纹理阶段的输出在传递到下一个阶段之前是否都固定在 [0, 1]？ spec说(第 153 页): If the value of TEXTURE_E
opengl - openGL ES和OpenGL函数的区别
我比较了 2 个函数 openGL ES 和 openGL gvec4 texelFetchOffset(gsampler2DArray sampler, ivec3 P, int lod, ivec
opengl - OpenGL 中的门户效果
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 10 年前。 Improve thi
opengl - OpenGL 绘图库
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 6年前关闭。 Improve this qu
opengl - opengl 函数会导致主线程卡住吗？
那么当你调用opengl函数时，比如glDraw或者gLBufferData，是否会导致程序线程停止等待GL完成调用呢？如果不是，那么 GL 如何处理调用像 glDraw 这样的重要函数，然后立即更
opengl - OpenGL 上的级联阴影贴图纹理访问错误
我正在尝试实现级联阴影贴图，当我想访问我的视锥体的每个分区的相应深度纹理时，我遇到了一个错误。更具体地说，当我想选择正确的阴影纹理时会出现我的问题，如果我尝试下面的代码，我会得到一个像 this 中
opengl - OpenGL ES和OpenGL兼容的着色器
我想为OpenGL ES和OpenGL(Windows)使用相同的着色器源。为此，我想定义自定义数据类型并仅使用OpenGL ES函数。一种方法是定义: #define highp #define
opengl - OpenGL 中的立方体映射
我尝试用 6 个位图映射立方体以实现天空盒效果。我的问题是一个纹理映射到立方体的每个面。我已经检查了 gDEBugger，在立方体纹理内存中我只有一个图像(因为我尝试加载六个图像)。代码准备纹理:
opengl - OpenGL 中的深度偏移
在 OpenGL 中偏移深度的最佳方法是什么？我目前每个多边形都有索引顶点属性，我将其传递给 OpenGL 中的顶点着色器。我的目标是在深度上偏移多边形，其中最高索引始终位于较低索引的前面。我目前有这

首页

博学

6Ren·AI

商城

opengl-es - 在 OpenGL ES 中优化骨骼动画的顶点