ios - Metal 渲染真的很慢 - 如何加快速度-6ren

ios - Metal 渲染真的很慢 - 如何加快速度

转载作者：塔克拉玛干更新时间：2023-11-02 09:14:43

26

4

我有一个运行速度非常慢的 Metal 应用程序，需要运行得更快。我相信问题是我创建了太多 MTLCommandBuffer 对象。

我创建这么多 MTLCommandBuffer 对象的原因是我需要向像素着色器发送不同的统一值。我粘贴了一段代码来说明下面的问题。

  for (int obj_i = 0 ; obj_i < n ; ++obj_i)
  {
     // I create one render command buffer per object I draw so I can use  different uniforms
     id <MTLCommandBuffer> mtlCommandBuffer = [metal_info.g_commandQueue commandBuffer];
     id <MTLRenderCommandEncoder> renderCommand = [mtlCommandBuffer renderCommandEncoderWithDescriptor:<#(MTLRenderPassDescriptor *)#>]

     // glossing over details, but this call has per object specific data
     memcpy([global_uniform_buffer contents], per_object_data, sizeof(per_data_object));

     [renderCommand setVertexBuffer:object_vertices  offset:0 atIndex:0];
     // I am reusing a single buffer for all shader calls
     // this is killing performance
     [renderCommand setVertexBuffer:global_uniform_buffer offset:0 atIndex:1];

     [renderCommand drawIndexedPrimitives:MTLPrimitiveTypeTriangle
                               indexCount:per_object_index_count
                               indexType:MTLIndexTypeUInt32
                             indexBuffer:indicies
                       indexBufferOffset:0];
     [renderCommand endEncoding];
     [mtlCommandBuffer presentDrawable:frameDrawable];
     [mtlCommandBuffer commit];
}

上面的代码按预期绘制，但是非常慢。我猜是因为有一种比为每个对象创建 MTLCommandBuffer 更好的方法来强制像素着色器评估。

我考虑过简单地分配一个比单个着色器 channel 所需的缓冲区大得多的缓冲区，并简单地使用偏移量在一个渲染命令编码器中排队多个调用，然后执行它们。这种方法看起来很不正统，我想确保我正在解决以 Metal 友好的方式为每个对象发送自定义数据所需的问题。

使用每次调用自定义统一数据对同一像素/顶点着色器进行多次渲染的最快渲染方式是什么？

最佳答案

不要为每个对象重复使用相同的统一缓冲区。这样做会破坏 CPU 和 GPU 之间的所有并行性并导致正常的同步点。

相反，为您要在帧中渲染的每个对象创建一个单独的统一缓冲区。事实上，您真的应该为每个对象创建 2 个对象，并在每帧之间交替，这样 GPU 就可以渲染最后一帧，而您正在 CPU 上准备下一帧。

在你这样做之后，你只需重构你的循环，这样命令缓冲区和渲染命令工作每帧完成一次。您的循环应该只包括复制统一数据、设置顶点缓冲区和调用绘图原语。

关于ios - Metal 渲染真的很慢 - 如何加快速度，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30087187/

26

4

0

文章推荐： ios - 协议(protocol)的方法调配

文章推荐： ios - Objective-C : validity check for an enum variable

文章推荐： ios - 如何从 NSmutableDictionary 中删除值(不是键)

两个表之间的 Postgis ST_Intersects 真的(真的)很慢
我正在尝试在两个表之间进行空间连接: 表 1:397265 个特征(在 geom 字段上有 gist 索引) 表 2:73 个特征(在 geom 字段上有 gist 索引) 表 1 和表 2 具有相同
两个表之间的 Postgis ST_Intersects 真的(真的)很慢
我正在尝试在两个表之间进行空间连接: 表 1:397265 个特征(在 geom 字段上有 gist 索引) 表 2:73 个特征(在 geom 字段上有 gist 索引) 表 1 和表 2 具有相同
java - 枚举类型的值是该类型的静态变量。真的？
枚举类型的值是该类型的静态变量。据我所知，变量是由引用变量引用的，但没有新的运算符来实例化枚举对象。但这就像初始化数组一样吗？这是对还是错？最佳答案是的，枚举类型的文字是 public sta
autocomplete - *真的*关闭zsh自动更正
我阅读了有关关闭 zsh 自动更正以完成命令的所有提示。但是，它们并没有完全发挥作用。我试过 DISABLE_CORRECTION="true", unsetopt correct, unsetopt
firefox - 如何获得firefox语言设置？ (真的)
我知道这个问题是 answered before ，但给出的答案并不是完整的故事: 我进入了 Firefox 的 Options->Content 并删除了除德语/德国之外的所有语言，navigato
assembly - 汇编语言有多不可移植，/真的/？
我知道用汇编语言编写任何内容或将汇编语言添加到任何程序都会损害其可移植性。但是，有多糟糕呢？我的意思是，现在基本上所有 PC 都是 x86 或 x64，对吧？那么，如果我将汇编嵌入到 C 程序中，为什
java - 我应该用一会儿吗(真的)
我正计划构建一个 Web 服务客户端，它始终检查数据库中的某些记录，并根据数据库内容的结果在每个时刻及时执行某些决策。所以我在想，我怎样才能让客户端一直运行呢？我唯一想到的就是无限循环。像这样的东
python - 获取小部件的背景颜色 - 真的
我无法获取小部件的实际背景颜色。在我的特殊情况下，我在使用 QTabWidget 中的小部件时遇到了问题。这是在 Windows7 上。所以经典小部件有一些灰色背景，而选项卡中的小部件通常用白色背景
android - 如何包装首选项标题？ (真的)
请不要将我指向How to wrap preference title?因为它不适用于(正如我评论的那样)您使用 @strings/ 的情况对 strings.xml 文件的引用。如果你使用 and
hadoop - 在Hive更新期间HDFS中发生了什么(真的)？
情况如下：已知hdfs是仅附加的（本身没有更新）。配置单元将数据写入其位于hdfs中的仓库。可以在配置单元中执行更新这意味着写入了新数据，旧数据应该以某种方式标记为已弃用，然后在某个时间将其清
javascript - *真的*用javascript删除cookies
在javascript中删除cookies的方法是将过期日期设置为过去。现在这实际上并没有删除 cookie，至少在 Firefox 中是这样。这只是意味着 cookie 将在浏览器关闭时被删除。这
c# - 杀死线程，真的!
我需要终止一个卡住的线程，我将 IsBackground 设置为 true 但它仍然存在。线程的属性: ThreadState = AbortRequested IsBackground = true
boolean - 有没有理由写.eqv。。真的。？
在逻辑中，以及在 *ahem* 正确设计的编程语言中，将 boolean 值与 true 进行比较总是多余的，即 a == True 应该简单地替换为 a 。 (类似地， a == False 由 n
multithreading - "thread"(真的)是什么？
我一直在努力寻找一个好的定义，并理解线程到底是什么。看来我一定错过了一些明显的东西，但是每次我读到什么是线程时，它几乎是一个循环定义，la“线程是一个执行线程”或“一种划分运行任务的方法” ”。呃呃
c++ - 你(真的)编写异常安全代码吗？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
intellij-idea - IntelliJ全面屏，真的
是否可以在 MAC 上以真正的全屏模式运行 IntelliJ Idea？没有工具栏、侧边栏、按钮，只有代码。如果可以，请告诉我。最佳答案您可以通过禁用以下项目在 View 菜单中执行此操作:
scala - 将案例类用于可变状态是否(真的)不好？
考虑以下代码: case class Vector3(var x: Float, var y: Float, var z: Float) { def add(v: Vector3): Unit =
java - 模型 - 持久层和服务层？真的？
我试图确认这个说法是否属实: 模型包括: 持久层:本质上是 DAO + 表示表的类 + DTO 服务层:DAOS + 一些逻辑的组合您能否也引用/支持您的回答？我相信我在Spring Framewo
c++ - 虚拟基类子对象的多个实例(真的)——不可能吗？
给定代码: #include struct X {}; struct Y1: virtual X {}; struct Y2: virtual X {}; struct Y3: virtual X
c++ - 不，真的，浮点提升什么时候发生？
从这个其他QUESTION他们谈论 Bjarne Stroustrup 是如何说的，就像比 int 窄的整数数据类型(例如 short)被提升为 int，float 被提升为 double。但是，与i

首页

博学

6Ren·AI

商城

ios - Metal 渲染真的很慢 - 如何加快速度