gpt4 book ai didi

vulkan - 我应该尝试使用尽可能多的队列吗?

转载 作者:行者123 更新时间:2023-12-03 15:14:52 28 4
gpt4 key购买 nike

在我的机器上,我有两个队列系列,一个支持一切,一个只支持传输。

支持一切的队列家族的 queueCount 为 16 .

现在规范指出

Command buffers submitted to different queues may execute in parallel or even out of order with respect to one another



这是否意味着我应该尝试使用所有可用队列以获得最大性能?

最佳答案

是的,如果您有高度独立的工作负载,请使用单独的队列。

如果队列需要在它们之间进行大量同步,它可能会扼杀您可能获得的任何潜在好处。

基本上,您正在做的是在相同队列系列的情况下为 GPU 提供一些它可以做的替代工作(并填充停顿、气泡和空闲,并为 GPU 提供选择)。并且有一些潜力可以更好地使用 CPU(例如,单线程 vs 每个线程一个队列)。

使用单独的传输队列(或其他专业系列)似乎甚至是推荐的方法。

这是一般的说法。 SW 和 NB 的回答已经提出了更现实、经验、怀疑和实用的观点。实际上,由于这些队列针对相同的资源,具有相同的限制和其他常见限制,因此必须更加谨慎,从而限制了从中获得的潜在好处。值得注意的是,如果驱动程序对多个队列做了错误的事情,那么缓存可能会非常糟糕。

这个AMD的Leveraging asynchronous queues for concurrent execution (2016) 讨论了它如何映射到他们的硬件\驱动程序。它显示了使用单独队列系列的潜在好处。它说,虽然他们提供了两个计算系列队列,但当时他们没有观察到应用程序的好处。他们说他们只有一个图形队列,以及为什么。

NVIDIA 似乎对“异步计算”也有类似的想法。显示在 Moving to Vulkan: Asynchronous compute .

为了安全起见,尽管在当前的硬件上,我们似乎仍然应该只使用一个图形和一个异步计算队列。 16 个队列似乎是一个陷阱,也是一种伤害自己的方式。

对于传输队列,它也并不像看起来那么简单。您应该使用专用的主机-> 设备传输。并且非专用应该用于设备->设备传输操作。

关于vulkan - 我应该尝试使用尽可能多的队列吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37575012/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com