- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我已经阅读了几篇关于 CPU-GPU(使用栅栏)和 GPU-GPU(使用信号量)同步机制的文章,但仍然无法理解我应该如何实现一个简单的渲染循环。
请看简单的render()
下面的功能。如果我猜对了,最低要求是我们确保 vkAcquireNextImageKHR
之间的 GPU-GPU 同步。 , vkQueueSubmit
和 vkQueuePresentKHR
通过一组信号量image_available
和 rendering_finished
正如我在下面的示例代码中所做的那样。
然而,这真的省了吗?所有操作都是异步的。那么,“重用”image_available
真的安全吗?在后续调用 render()
中的信号量即使之前调用的信号请求还没有触发?我认为不是,但是另一方面,我们使用相同的队列(不知道图形和表示队列实际上是否相同是否重要)并且队列内的操作应该按顺序使用.. .但如果我做对了,它们可能不会“作为一个整体”被消耗,并且可以重新排序......
第二件事是(同样,除非我遗漏了什么)我显然应该为每个交换链图像使用一个栅栏,以确保对图像的操作对应于 image_index
调用render()
已完成。但这是否意味着我一定需要做一个
if (vkWaitForFences(device(), 1, &fence[image_index_of_last_call], VK_FALSE, std::numeric_limits<std::uint64_t>::max()) != VK_SUCCESS)
throw std::runtime_error("vkWaitForFences");
vkResetFences(device(), 1, &fence[image_index_of_last_call]);
在我调用
vkAcquireNextImageKHR
之前?那么我需要专门的
image_available
吗?和
rendering_finished
每个交换链图像的信号量?或者也许每帧?或者也许每个命令缓冲区/池?我真的很困惑...
void render()
{
std::uint32_t image_index;
switch (vkAcquireNextImageKHR(device(), swap_chain().handle(),
std::numeric_limits<std::uint64_t>::max(), m_image_available, VK_NULL_HANDLE, &image_index))
{
case VK_SUBOPTIMAL_KHR:
case VK_SUCCESS:
break;
case VK_ERROR_OUT_OF_DATE_KHR:
on_resized();
return;
default:
throw std::runtime_error("vkAcquireNextImageKHR");
}
static VkPipelineStageFlags constexpr wait_destination_stage_mask = VK_PIPELINE_STAGE_COLOR_ATTACHMENT_OUTPUT_BIT;
VkSubmitInfo submit_info{};
submit_info.sType = VK_STRUCTURE_TYPE_SUBMIT_INFO;
submit_info.waitSemaphoreCount = 1;
submit_info.pWaitSemaphores = &m_image_available;
submit_info.signalSemaphoreCount = 1;
submit_info.pSignalSemaphores = &m_rendering_finished;
submit_info.pWaitDstStageMask = &wait_destination_stage_mask;
if (vkQueueSubmit(graphics_queue().handle, 1, &submit_info, VK_NULL_HANDLE) != VK_SUCCESS)
throw std::runtime_error("vkQueueSubmit");
VkPresentInfoKHR present_info{};
present_info.sType = VK_STRUCTURE_TYPE_PRESENT_INFO_KHR;
present_info.waitSemaphoreCount = 1;
present_info.pWaitSemaphores = &m_rendering_finished;
present_info.swapchainCount = 1;
present_info.pSwapchains = &swap_chain().handle();
present_info.pImageIndices = &image_index;
switch (vkQueuePresentKHR(presentation_queue().handle, &present_info))
{
case VK_SUCCESS:
break;
case VK_ERROR_OUT_OF_DATE_KHR:
case VK_SUBOPTIMAL_KHR:
on_resized();
return;
default:
throw std::runtime_error("vkQueuePresentKHR");
}
}
编辑 :正如以下答案中所建议的,假设我们有
k
“飞行中的帧”,因此
k
上面代码中使用的信号量和栅栏的实例,我将用
m_image_available[i]
表示,
m_rendering_finished[i]
和
m_fence[i]
对于
i = 0, ..., k - 1
.让
i
表示飞行中帧的当前索引,增加
1
每次调用
render()
之后, 和
j
表示
render()
的调用次数, 从
j = 0
开始.
j = 0
,然后 i = 0
飞行中的第一帧正在使用交换链图像 0
j = a
,然后 i = a
和 a
飞行中的第 1 帧正在使用交换链图像 a
, 对于 a= 2, 3
j = 3
,然后 i = 3
,但由于交换链图像只有三个图像,所以第四帧正在使用交换链图像0
再次。我想知道这是否有问题。我猜不是,因为等待/信号信号量 m_image_available[3]
/m_rendering_finished[3]
, 用于 vkAcquireNextImageKHR
的调用, vkQueueSubmit
和 vkQueuePresentKHR
在这个 render()
的调用中, 专用于飞行中的这个特定帧。 j = k
,然后 i = 0
再次,因为只有 k
飞行中的帧。现在我们可能在 render()
的开头等待, 如果调用 vkQueuePresentKHR
从 i = 0
的第一次调用 ( render()
)未发出信号m_fence[0]
然而。 k
尽可能大?我理论上可以想象的是,如果我们以比 GPU 能够消耗的更快的方式向 GPU 提交工作,则使用的队列可能会不断增长并最终溢出(队列中是否存在某种“最大命令“限制?)。
最佳答案
If I got it right, the minimal requirement is that we ensure the GPU-GPU synchronization between vkAcquireNextImageKHR, vkQueueSubmit and vkQueuePresentKHR by a single set of semaphores image_available and rendering_finished as I've done in the example code below.
vkAcquireNextImageKHR
提交了获得要渲染的新图像的愿望。 .演示引擎将发出
m_image_available
的信号。一旦要渲染的图像可用,就可以使用信号量。但是您已经提交了指令。
submit_info
向图形队列提交一些命令。 . IE。它们也已经提交给 GPU 并在那里等到
m_image_available
信号量接收它的信号。
submit_info
的依赖关系。 - 命令已通过等待
m_rendering_finished
完成信号。
render()
功能和重复使用相同的
m_image_available
和
m_rendering_finished
信号量,它只有在你非常幸运的情况下才会起作用,即如果所有信号量在你再次使用它们之前已经发出信号。
vkAcquireNextImageKHR
的规范说明如下:
If semaphore is not VK_NULL_HANDLE it must not have any uncompleted signal or wait operations pending
the act of waiting for a binary semaphore also unsignals that semaphore.
vkAcquireNextImageKHR
使用相同的
m_image_available
信号量已完成。
vkQueueSubmit
的东西使用栅栏。 .如果您不在 CPU 上进行同步,您将把更多的工作推给 GPU(这是一个问题),并且您正在重复使用的信号量可能无法及时正确地取消信号(这是一个问题)。
关于c++ - 在 Vulkan 中,每个交换链图像、每个帧或每个命令池是否需要专用的栅栏/信号量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65054157/
我有一个栅栏的 3D 模型。该模型包含 1 个起始柱和 1 个末端柱,中间有一个连接玻璃板。假设我希望能够指定任意长度的栅栏,并将其放置在虚拟世界中。如果可能的话,我将如何处理原始 3D 模型以将其更
x86指令lfence/sfence/mfence用于实现Linux内核中的rmb()/wmb()/mb()机制。很容易理解,这些用于序列化内存访问。但是,在遇到运行时行为中的错误之前,在编写代码时确
以下代码实现了一些无锁(且无原子!)的线程间通信,这些通信需要使用存储和加载内存屏障,但是C++ 11 release-acquire语义不适当,也不保证正确性。实际上,该算法暴露了对发布获取语义的某
我是一名优秀的程序员,十分优秀!