gpt4 book ai didi

macos - 命令编码器之间的同步何时需要 MTLFence 或 MTLEvent?

转载 作者:行者123 更新时间:2023-12-05 03:03:46 27 4
gpt4 key购买 nike

注意:在很多方面,这是 How do you synchronize a Metal Performance Shader with an MTLBlitCommandEncoder? 的后续行动

当顺序命令编码器之间需要显式同步以及由于 Metal 的架构不需要同步时,我仍然有点困惑。

在上面链接的问题中,Apple 的文档被引用为:

Memory Barriers

Between Command Encoders

All resource writes performed in a given command encoder are visible in the next command encoder. This is true for both render and compute command encoders.

我将其解释为暗示一个 MTLRenderCommandEncoder 不需要与前一个 MTLBlitCommandEncoder 显式同步,如果它们都在同一个命令缓冲区中并且一个接一个地发生。

但是,Apple 自己的示例代码似乎与此相矛盾。在 Image Filter Graph with Heaps and Fences , 它表明需要 MTLFence 来同步访问纹理,该纹理首先在 MTLBitCommandEncoder 中使用,然后是两个连续的 MTLComputeCommandEncoder 调用. (一个用于水平模糊,一个用于垂直模糊。)

See:
AAPLFilter.m (L:199)
AAPLRenderer.m (L:413)

这些命令编码器在同一个命令缓冲区中执行。为什么第一个 MTLComputeCommandEncoder 需要显式等待 blit 完成,为什么第二个计算编码器需要等待第一个计算编码器,如果如上所述,“在给定命令编码器中执行的所有资源写入在下一个命令编码器中都是可见的。”?

伪示例代码:

- (void)drawInMTKView:(nonnull MTKView *)view {

id <MTLCommandBuffer> commandBuffer = [_commandQueue commandBuffer];

id<MTLTexture> masterTexture = self.masterTexture;
id<MTLTexture> incomingTexture = [self dequeueRenderedTextureIfPresent];

id<MTLBlitCommandEncoder> blitEncoder = commandBuffer.blitCommandEncoder;
[blitEncoder copyFromTexture:incomingTexture ... toTexture:masterTexture];
[blitEncoder endEncoding];

id <MTLRenderCommandEncoder> renderEncoder = [commandBuffer renderCommandEncoderWithDescriptor];

// Is synchronization with the blit encoder required here?
//
// The fragment shader is going to sample from masterTexture and will
// expect that the blit command above will have been completed.

[renderEncoder setFragmentTexture:masterTexture atIndex:0];

[renderEncoder drawPrimitives:...];
[commandBuffer commit];
}

在上面的伪代码中,渲染命令编码器是否必须显式等待 blit 命令编码器完成?在回答我的previous question ,我相信答案是“否”。但是看看 Apple 的使用栅栏和事件的示例代码,我相信答案是"is"。

如果不需要同步,那么这个伪代码和苹果的示例代码有什么不同?

编辑#1:

多亏了 Ken 在下面的回答,我很快在 Apple 的开发者论坛上找到了一个涵盖这个确切问题的相关主题。

Apple 开发者论坛:MTLFence detailed behaviour?

正如 Ken 正确指出的那样,要理解的关键细节是跟踪纹理和未跟踪纹理之间的区别。

最佳答案

只有 Metal 不会自动跟踪的资源才需要这种手动同步。不会自动跟踪从 MTLHeap 分配的资源。使用 MTLResourceHazardTrackingModeUntracked 选项明确创建的资源也未被跟踪。

来自您链接的带有堆和栅栏示例的图像过滤器图的概述,在 Optimize Resource Allocation and Performance 下:

When resources are allocated from a device, Metal creates and tracks additional state to ensure that the resource memory is allocated, synchronized, and made available throughout the lifetime of any command buffer that needs the given resource. It does so even if the resource itself is destroyed before the command buffer begins execution.

Although Metal also carries out this process for heaps, it doesn’t do so for resources within the heap. Instead, the app must perform explicit fine-grained synchronization when it creates objects from the heap and reuses memory.

如果资源未被跟踪,您问题中的伪代码只需要显式同步。

关于macos - 命令编码器之间的同步何时需要 MTLFence 或 MTLEvent?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53579212/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com