- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
注意:在很多方面,这是 How do you synchronize a Metal Performance Shader with an MTLBlitCommandEncoder? 的后续行动
当顺序命令编码器之间需要显式同步以及由于 Metal 的架构不需要同步时,我仍然有点困惑。
在上面链接的问题中,Apple 的文档被引用为:
Memory Barriers
Between Command Encoders
All resource writes performed in a given command encoder are visible in the next command encoder. This is true for both render and compute command encoders.
我将其解释为暗示一个 MTLRenderCommandEncoder
不需要与前一个 MTLBlitCommandEncoder
显式同步,如果它们都在同一个命令缓冲区中并且一个接一个地发生。
但是,Apple 自己的示例代码似乎与此相矛盾。在 Image Filter Graph with Heaps and Fences , 它表明需要 MTLFence
来同步访问纹理,该纹理首先在 MTLBitCommandEncoder
中使用,然后是两个连续的 MTLComputeCommandEncoder
调用. (一个用于水平模糊,一个用于垂直模糊。)
See:
AAPLFilter.m (L:199)
AAPLRenderer.m (L:413)
这些命令编码器在同一个命令缓冲区中执行。为什么第一个 MTLComputeCommandEncoder
需要显式等待 blit
完成,为什么第二个计算编码器需要等待第一个计算编码器,如果如上所述,“在给定命令编码器中执行的所有资源写入在下一个命令编码器中都是可见的。”?
伪示例代码:
- (void)drawInMTKView:(nonnull MTKView *)view {
id <MTLCommandBuffer> commandBuffer = [_commandQueue commandBuffer];
id<MTLTexture> masterTexture = self.masterTexture;
id<MTLTexture> incomingTexture = [self dequeueRenderedTextureIfPresent];
id<MTLBlitCommandEncoder> blitEncoder = commandBuffer.blitCommandEncoder;
[blitEncoder copyFromTexture:incomingTexture ... toTexture:masterTexture];
[blitEncoder endEncoding];
id <MTLRenderCommandEncoder> renderEncoder = [commandBuffer renderCommandEncoderWithDescriptor];
// Is synchronization with the blit encoder required here?
//
// The fragment shader is going to sample from masterTexture and will
// expect that the blit command above will have been completed.
[renderEncoder setFragmentTexture:masterTexture atIndex:0];
[renderEncoder drawPrimitives:...];
[commandBuffer commit];
}
在上面的伪代码中,渲染命令编码器是否必须显式等待 blit 命令编码器完成?在回答我的previous question ,我相信答案是“否”。但是看看 Apple 的使用栅栏和事件的示例代码,我相信答案是"is"。
如果不需要同步,那么这个伪代码和苹果的示例代码有什么不同?
编辑#1:
多亏了 Ken 在下面的回答,我很快在 Apple 的开发者论坛上找到了一个涵盖这个确切问题的相关主题。
Apple 开发者论坛:MTLFence detailed behaviour?
正如 Ken 正确指出的那样,要理解的关键细节是跟踪纹理和未跟踪纹理之间的区别。
最佳答案
只有 Metal 不会自动跟踪的资源才需要这种手动同步。不会自动跟踪从 MTLHeap
分配的资源。使用 MTLResourceHazardTrackingModeUntracked
选项明确创建的资源也未被跟踪。
来自您链接的带有堆和栅栏示例的图像过滤器图的概述,在 Optimize Resource Allocation and Performance 下:
When resources are allocated from a device, Metal creates and tracks additional state to ensure that the resource memory is allocated, synchronized, and made available throughout the lifetime of any command buffer that needs the given resource. It does so even if the resource itself is destroyed before the command buffer begins execution.
Although Metal also carries out this process for heaps, it doesn’t do so for resources within the heap. Instead, the app must perform explicit fine-grained synchronization when it creates objects from the heap and reuses memory.
如果资源未被跟踪,您问题中的伪代码只需要显式同步。
关于macos - 命令编码器之间的同步何时需要 MTLFence 或 MTLEvent?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53579212/
我正在实现 IMAP 客户端,但 IMAP 邮箱同步出现问题。 首先,可以从 IMAP 服务器获取新邮件,但我不知道如何从邮箱中查找已删除的邮件。 我是否应该从服务器获取所有消息并将其与本地数据进行比
我研究线程同步。当我有这个例子时: class A { public synchronized void methodA(){ } public synchronized void met
嗨,我做了一个扩展线程的东西,它添加了一个包含 IP 的对象。然后我创建了该线程的两个实例并启动它们。他们使用相同的列表。 我现在想使用 Synchronized 来阻止并发更新问题。但它不起作用,我
我正在尝试使用 FTP 定期将小数据文件从程序上传到服务器。用户从使用 javascript XMLHttpRequest 函数读取数据的网页访问数据。这一切似乎都有效,但我正在努力解决由 FTP 和
我不知道如何同步下一个代码: javascript: (function() { var s2 = document.createElement('script'); s2.src =
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭 7 年前。 Improve this qu
一 点睛 1 Message 在基于 Message 的系统中,每一个 Event 也可以被称为 Message,Message 是对 Event 更高一个层级的抽象,每一个 Message 都有一个
一 点睛 1 Message 在基于 Message 的系统中,每一个 Event 也可以被称为 Message,Message 是对 Event 更高一个层级的抽象,每一个 Message 都有一个
目标:我所追求的是每次在数据库中添加某些内容时(在 $.ajax 到 Submit_to_db.php 之后),从数据库获取数据并刷新 main.php(通过 draw_polygon 更明显)。 所
我有一个重复动画,需要与其他一些 transient 动画同步。重复动画是一条在屏幕上移动 4 秒的扫描线。当它经过下面的图像时,这些图像需要“闪烁”。 闪烁的图像可以根据用户的意愿来来去去和移动。它
我有 b 个块,每个块有 t 个线程。 我可以用 __syncthreads() 同步特定块中的线程。例如 __global__ void aFunction() { for(i=0;i #
我正在使用azure表查询来检索分配给用户的所有错误实体。 此外,我更改了实体的属性以声明该实体处于处理模式。 处理完实体后,我将从表中删除该实体。 当我进行并行测试时,可能会发生查询期间,一个实体已
我想知道 SQLite 是如何实现它的。它基于文件锁定吗?当然,并不是每个访问它的用户都锁定了整个数据库;那效率极低。它是基于多个文件还是仅基于一个大文件? 如果有人能够简要概述一下 sqlite 中
我想post到php,当id EmpAgree1时,然后它的post变量EmpAgree=1;当id为EmpAgree2时,则后置变量EmpAgree=2等。但只是读取i的最后一个值,为什么?以及如何
CUBLAS 文档提到我们在读取标量结果之前需要同步: “此外,少数返回标量结果的函数,例如 amax()、amin、asum()、rotg()、rotmg()、dot() 和 nrm2(),通过引用
我知道下面的代码中缺少一些内容,我的问题是关于 RemoteImplementation 中的同步机制。我还了解到该网站和其他网站上有几个关于 RMI 和同步的问题;我在这里寻找明确的确认/矛盾。 我
我不太确定如何解决这个问题......所以我可能需要几次尝试才能正确回答这个问题。我有一个用于缓存方法结果的注释。我的代码目前是一个私有(private)分支,但我正在处理的部分从这里开始: http
我对 Java 非常失望,因为它不允许以下代码尽可能地并发移动。当没有同步时,两个线程会更频繁地切换,但是当尝试访问同步方法时,在第二个线程获得锁之前以及在第一个线程获得锁之前再次花费太长时间(比如
过去几周我一直在研究java多线程。我了解了synchronized,并理解synchronized避免了多个线程同时访问相同的属性。我编写此代码是为了在同一线程中运行两个线程。 val gate =
我有一个关于 Java 同步的简单问题。 请假设以下代码: public class Test { private String address; private int age;
我是一名优秀的程序员,十分优秀!