- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前正在研究 Apple 的 Metal API,但我无法理解如何实现大量实例的渲染,因为每个实例都需要有自己的(部分)缓冲区。
假设我想绘制大约 50.000 个模型实例(我承认这很荒谬。)每个实例都将其定位和骨骼动画数据存储在缓冲区中,假设每个实例有 50 个关节。现在考虑到最多可以同时渲染三个帧,我需要这些实例缓冲区乘以帧数。
这将导致相当荒谬的缓冲区大小,仅用于绘制实例。另外,应该如何实现不同数量的实例,如果当前实例不能容纳要呈现的所有对象的数据,则分配更大的缓冲区?只需决定每帧的最大实例数?
我研究过的所有文章和教程似乎都表明:场景中存在最大数量的对象。
最佳答案
让我们来计算一下。为了便于讨论,我们将忽略静态网格几何体的大小和其他并非每帧都更新的数据(如反向绑定(bind)矩阵,如果您正在执行矩阵调色板蒙皮)。每个皮肤实例数据缓冲区有多大?
Instance count * joint count * elements per skinning matrix * bytes per matrix element
50,000 * 50 * 12 * 4 = 120 MB
(我忽略了每帧可能不同的其他因素,因此如果有帮助,请将这些数字替换为真实数据的数量级。其余分析仍然适用。)
所以是的,有相当大的空间,但不一定不可行。我们可能会选择回到双缓冲而不是三缓冲所有内容,将所需的总空间从 360 MB 减少到 240 MB。
我们还假设我们正在使用 3x4 矩阵进行矩阵调色板蒙皮。我们可以使用 dual quaternion skinning 再次将所需空间减半。 .
这里的一个问题是,如果我们在独立的 GPU 上运行,将每帧 60 MB 的蒙皮数据传输到 GPU 会消耗大量带宽。因此,我们可能会考虑将我们的联合计算转移到 GPU。在具有共享内存架构的 iOS 上,这不是一个问题。无论哪种方式,我们都希望了解如何计算变换层次结构,因为如果每个关节在每一帧都移动,我们将进行大量乘法运算。
至于变化的实例数,我们绝对不想做的一件事是每帧重新分配新的缓冲区。相反,我们可以重新分配缓冲区,增加其大小 geometrically ,当我们注意到实例数量超过了我们缓冲区的当前最大容量时。
或者,我们可以采用“分页”方法并将实例拆分到多个缓冲区,每个缓冲区可以容纳一些大量的实例,并且一旦 GPU 被添加到可重复使用的缓冲池中,它们就会被回收从他们那里完成渲染。这确实需要将渲染拆分为多个绘制调用(除非我们可能正在使用参数缓冲区),但是发出 10 个实例化绘制调用(每个具有 1/10 的实例)的开销与时间相比可以忽略不计需要实际渲染。
我们还可以考虑使用 MTLHeap
来创建 transient 缓冲区,这比直接从我们的设备分配缓冲区成本更低,但这仍然需要选择一个合理的初始上限,并根据实例的最大数量增长/重新分配增加。
归根结底,基准胜过理论。自然地,您应该从分析您的数据开始,就像我们在这里尝试做的那样,但是构建一个测试应用程序并将这些想法付诸实践,注意实际出现问题的地方,是确定您需要多少优化的唯一真正方法在您的目标平台上顺利运行。
关于buffer - Metal 实例渲染——几个问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58226952/
在 Metal 中,在着色器内部(进出)使用什么坐标系?当我们渲染到纹理时是一样的吗?也有z缓冲区?有没有不一致的地方?最后 Metal ,opengl和directX有什么区别? 最佳答案 Meta
我正在尝试在 Mac 上的 Apple metal 中开发我自己的迷你游戏引擎,但我被困在我想在 GPU 上渲染文本的地方。我没有太多的图形编程经验,因此我不知道该怎么做。我偶然发现了 Warren
我找不到答案的简单问题,在 openGL 上有一个 glDeleteTextures(1, &t) 显然模型有很大的不同,但我想知道 Metal 是否有相同的需要或要求。 MTLTexture 是通过
我是 Metal 新手。我想使用 Metal 计算来做一些数学运算,所以我创建了一个内核函数(着色器?),比方说 kernel void foo(device float *data1,
我假设除了 Metal 之外的其他 API 中存在颜色附件(我肯定知道 OpenGL),但我是图形编程的新手,我想知道颜色附件在概念上到底是什么。我所做的所有绘图都涉及在颜色附件数组中的第一个设置属性
在计算着色器中,我可以看到双三次是一个选项,但前提是定义了 __HAVE_BICUBIC_FILTERING__。当我将 bicubic 设置为过滤选项时,出现语法错误。 Linear 或Neares
这是一个绝对的初学者问题。 背景:我并不是真正的游戏开发者,但我正在努力学习底层 3D 编程的基础知识,因为这是一个有趣且有趣的话题。我选择了 Apple 的 Metal 作为图形框架。我知道 Sce
在 GLSL 中,我只需使用 out vec3 array[10]; 将数组从顶点着色器传递到片段着色器。然而,在 Metal 中,我想这样做: struct FragmentIn { flo
我看到 Apple GPU 硬件和 iOS/MacOS 版本的组合决定了一个功能集。我可以使用下面的快速代码片段查询我的 MTLDevice 支持哪些功能集。 device.supportsFeatu
我想将深度缓冲区保存到 Metal 纹理中,但我尝试过的任何方法似乎都不起作用。 _renderPassDesc.colorAttachments[1].clearColor = MTLClearCo
我想在我的 Metal 应用程序中实现一个 A-Buffer 算法来实现与订单无关的透明度。该技术的描述提到使用原子计数器。我从未使用过其中之一,甚至没有听说过。我刚刚阅读了 Metal Shadin
假设我有一个 N channel MPSImage 或基于 MTLTexture 的纹理数组。 我如何从中裁剪一个区域,复制所有 N 个 channel ,但改变“像素大小”? 最佳答案 我将只讨论裁
TL;DR:Metal 似乎没有检测到我的顶点着色器返回的内容 我有这两个用 MSL 编写的函数: vertex float4 base_image_rect(constant float4 *pos
如何在目标设置为 iOS 模拟器的情况下在 Xcode 6 中编译 iOS «Metal» 游戏? error: can't exec 'metal' (No such file or directo
将一些基本的 OpenGL ES 2.0 着色器移植到 Metal 着色器时,我不知道如何将 glsl 中的 in/inout/out 限定符转换为 Metal 着色器语言 (MSL)。例如, //O
我不想使用texture1d_array。我可以简单地传递一个 float 组吗?我将把它写入我的内核函数中。 最佳答案 为了写入内核函数内的 float 组,您需要向内核提供一个缓冲区参数。该参数应
我不想使用texture1d_array。我可以简单地传递一个 float 组吗?我将把它写入我的内核函数中。 最佳答案 为了写入内核函数内的 float 组,您需要向内核提供一个缓冲区参数。该参数应
我有一组 Metal 纹理作为纹理集存储在 Xcode Assets 目录中。我正在使用 MTKTextureLoader.newTexture(name:scaleFactor:bundle:opt
Apple 系统中似乎至少有六个矩阵库。其中之一是 simd 库,其类型在 CPU 和 GPU 代码中的工作方式相同。 import simd let mat = float3x3(...) let
有谁知道 Apple 的旧版本 Metal Feature Set Table 的可用性?文件? 当前的 Metal 3.0 文档仅引用 beta MTLGPUFamily 和 MTLSoftware
我是一名优秀的程序员,十分优秀!