- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我目前正在开发一个框架,可以方便地渲染大量动画模型。
一个模型被组织为一个简单的骨骼层次结构,根是躯干/骨盆,通常:
因此,作为伪代码,我目前正在渲染这样一个模型:
RenderBone(Bone b, Mat4x4 currentTransform){
Mat4x4 pos = currentTransform * b.boneTransform;
SetUniform("transformation", pos);
Draw(bone.mesh);
for each Bone bc in b.children do{
RenderBone(bc, pos);
}
}
因此对于使用具有 n 个骨骼的模型的单个 actor,我需要 n 个 SetUniform(不包括设置纹理之类的东西)和 n 个绘制调用。
为了减少这种开销并同时使用同一模型渲染所有 Actor ,我考虑切换到实例化渲染。
但是,我能找到的所有信息和教程都是关于绘制立方体、球体或类似简单对象的。在任何地方,我都看不到一些关于如何使用实例化绘图来渲染模型的简单易懂的信息,其中每个部分(骨骼)都需要为着色器提供不同的变换矩阵。
所以,问题:使用 glVertexAttribDivisor
或 gl_InstanceID
我只能指定与实例相关的矩阵,而不是骨骼相关矩阵。那么我该如何应用我的骨骼转换?
我能想到的唯一可行的解决方案是 - 我可以实例化每个骨骼,而不是实例化整个模型。因此绘制一种骨骼类型的所有实例,然后绘制另一种,依此类推。但是我仍然需要相对频繁地使用转换矩阵更新缓冲区,而且这是更多的内务处理代码。
那么这是最好的选择吗?或者,更一般地说,是否有更好的不太复杂的渲染方式?还是实例化渲染只有在与静态几何体一起使用时才真正发挥作用?
最佳答案
当您需要绘制数千 相同模型的拷贝时,您可以使用实例化。通常,带有骨骼的网格不是您需要绘制成千上万的东西。
实例化是一种优化,并不总能得到返回。除非您知道您需要它(通过分析并查看您是否达到性能目标),否则您不应该费心尝试使用它。即便如此,对于何时才是真正的性能改进也可能非常敏感。
有时,它只是无济于事。但这里有一些一般的经验法则:
请记住,这些是一般规则,而不是绝对的法律。它们还依赖于硬件。
So, the problem: Using glVertexAttribDivisor or gl_InstanceID I can only specify an instance-related matrix, not a bone-realted matrix. How do I apply my bone transformations then?
根据您看到的例子或您看到其他人所做的事情,您考虑得太多了。像程序员一样思考。
gl_InstanceID
不是“与实例相关的矩阵”;它是一个索引。您如何处理该索引完全取决于您。您见过的大多数示例都使用此索引来查找矩阵数组,可能存储在 uniform block 中或 buffer texture .该矩阵是您用于渲染的变换。每个索引代表单个实例的转换。
您的每个实例都有多个矩阵、多个转换。但是每个实例都有相同数量的骨骼(否则它不会被实例化渲染)。假设您有 5 根骨头。
同样,每个索引都是单个实例的转换。您的案例与标准之间的区别在于每个实例需要多少信息。常规情况需要一个矩阵;你需要五个。但无论哪种方式,想法都是一样的。
如果当前实例需要骨骼索引 3,只需使用以下表达式访问矩阵数组:(gl_InstanceID * 5) + 3
,其中 5 是每个实例的骨骼数。
剩下的就是使用每个顶点属性传递骨骼索引以用于变换每个顶点的简单问题。
关于c++ - OpenGL中动态模型的实例化绘制,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11972855/
在 OpenGL/ES 中,在实现渲染到纹理功能时,您必须小心,不要引起反馈循环(从正在写入的同一纹理中读取像素)。由于显而易见的原因,当您读取和写入纹理的相同像素时,行为是未定义的。但是,如果您正在
正如我们最终都知道的那样,规范是一回事,实现是另一回事。大多数错误是我们自己造成的,但有时情况并非如此。 我相信列出以下内容会很有用: GPU 驱动程序中当前已知的与最新版本的 OpenGL 和 GL
很难说出这里问的是什么。这个问题是模棱两可的、模糊的、不完整的、过于宽泛的或修辞的,无法以目前的形式得到合理的回答。为了帮助澄清这个问题以便可以重新打开它,visit the help center
我正在学习 OpenGL,非常想知道与显卡的交互如何。 我觉得了解它是如何在图形驱动程序中实现的,会让我了解 opengl 的完整内部结构(通过这个我可以知道哪些阶段/因素影响我对 opengl 性能
我正在尝试绘制到大于屏幕尺寸(即 320x480)的渲染缓冲区 (512x512)。 执行 glReadPixels 后,图像看起来是正确的,除非图像的尺寸超过屏幕尺寸——在本例中,超过 320 水平
我正在 Windows 中制作一个 3D 小行星游戏(使用 OpenGL 和 GLUT),您可以在其中穿过一堆障碍物在太空中移动并生存下来。我正在寻找一种方法来针对无聊的 bg 颜色选项设置图像背景。
如果我想要一个包含 100 个 10*10 像素 Sprite 的 Sprite 表,是否可以将它们全部排成一排来制作 1,000*10 像素纹理?还是 GPU 对不那么窄的纹理表现更好?这对性能有什
这个问题在这里已经有了答案: Rendering 2D sprites in a 3D world? (7 个答案) 关闭 6 年前。 我如何概念化让图像始终面对相机。我尝试将三角函数与 arcta
是否可以在 OpenGL 中增加缓冲区? 假设我想使用实例化渲染。每次在世界上生成一个新对象时,我都必须用实例化数据更新缓冲区。 在这种情况下,我有一个 3 个 float 的缓冲区 std::v
有人可以向我解释为什么下面的代码没有绘制任何东西,但如果我使用 GL_LINE_LOOP 它确实形成了一个闭环吗? glBegin(GL_POLYGON); for(int i = 0; i <= N
正如标题所说,OpenGL 中的渲染目标是什么?我对 OpenGL 很陌生,我看到的所有网站都让我很困惑。 它只是一个缓冲区,我在其中放置稍后将用于渲染的东西吗? 如果您能提供一个很好的引用来阅读它,
当使用 OpenGL 1.4 固定功能多纹理时,每个纹理阶段的输出在传递到下一个阶段之前是否都固定在 [0, 1]? spec说(第 153 页): If the value of TEXTURE_E
我比较了 2 个函数 openGL ES 和 openGL gvec4 texelFetchOffset(gsampler2DArray sampler, ivec3 P, int lod, ivec
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 10 年前。 Improve thi
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 6年前关闭。 Improve this qu
那么当你调用opengl函数时,比如glDraw或者gLBufferData,是否会导致程序线程停止等待GL完成调用呢? 如果不是,那么 GL 如何处理调用像 glDraw 这样的重要函数,然后立即更
我正在尝试实现级联阴影贴图,当我想访问我的视锥体的每个分区的相应深度纹理时,我遇到了一个错误。 更具体地说,当我想选择正确的阴影纹理时会出现我的问题,如果我尝试下面的代码,我会得到一个像 this 中
我想为OpenGL ES和OpenGL(Windows)使用相同的着色器源。为此,我想定义自定义数据类型并仅使用OpenGL ES函数。 一种方法是定义: #define highp #define
我尝试用 6 个位图映射立方体以实现天空盒效果。我的问题是一个纹理映射到立方体的每个面。我已经检查了 gDEBugger,在立方体纹理内存中我只有一个 图像(因为我尝试加载六个图像)。 代码准备纹理:
在 OpenGL 中偏移深度的最佳方法是什么?我目前每个多边形都有索引顶点属性,我将其传递给 OpenGL 中的顶点着色器。我的目标是在深度上偏移多边形,其中最高索引始终位于较低索引的前面。我目前有这
我是一名优秀的程序员,十分优秀!