gpt4 book ai didi

vulkan - 一个主机可见缓冲区而不是多个 - 我应该考虑一些对齐吗?

转载 作者:行者123 更新时间:2023-12-02 03:34:04 25 4
gpt4 key购买 nike

假设我有 280 字节的数据。如果我要创建一个缓冲区,那么根据 VkMemoryRequirements 分配的大小应为 512 字节,对齐方式为 512 - 这很清楚。但我需要一个主机可见的大缓冲区,可以容纳 3 个这样的数据(根据 nvidia 的说法,这比 3 个缓冲区更好)。我不清楚 - 我应该指定 VkBufferCreateInfo::size 等于 280 * 3 还是 512 * 3?如果我让它等于512 * 3,那就浪费空间了。如果我将其设置为280 * 3,映射内存时会出现问题吗?规范提到映射范围应该是 VkPhysicalDeviceLimits::nonCoherentAtomSize 的倍数,但仅限于未分配 VK_MEMORY_PROPERTY_HOST_COHERENT_BIT 的内存,这不是我的情况。主机一致性内存是否保证字节粒度内存更新?

最佳答案

如果您想创建一个可以容纳 3 * 280 字节数据的缓冲区,那么您需要创建一个可以容纳 3 * 280 字节数据的缓冲区(您需要在创建缓冲区时指定该值作为大小)。但它需要多少内存(内存对象应该有多大),这取决于驱动程序。您需要创建一个大小等于3 * 280的缓冲区,然后您需要检查它的内存需求,然后分配必要的内存对象(或从更大的内存对象进行子分配)并绑定(bind)该内存到缓冲区。

至于对齐 - 如果您想将单个内存对象的部分绑定(bind)到多个资源(缓冲区或图像),这很重要。在您的示例中,您可以创建 3 个可容纳 280 字节数据的缓冲区。但是(如 vkGetBufferMemoryRequirements() 函数所示)每个此类缓冲区需要 512 字节的内存对齐到 512 字节。因此,为了 3 个独立的缓冲区,您将需要 3 个独立的内存对象,每个大小为 512 字节,或者单个大小为 1536 字节的内存对象。然后,从偏移量 0 开始的内存范围可以绑定(bind)到第一个缓冲区,从偏移量 512 到第二个缓冲区,从偏移量 1024 到第三个缓冲区。但是,尽管您将 512 字节的内存绑定(bind)到您的缓冲区,但不要忘记您的缓冲区仍然只能容纳 280 字节的内存。

在此示例中,大小和对齐方式相同(均为 512)。想象一下这样一种情况,您的缓冲区大小为 380 字节,需要内存中的 386 字节与 512 对齐。这种情况不会改变任何内容 - 您的第一个缓冲区绑定(bind)到偏移量 0(此偏移量始终满足所有对齐要求),第二个缓冲区绑定(bind)到偏移量 512 和第三个缓冲区到偏移量 1024。一般来说,对齐意味着绑定(bind)到资源的内存范围的开始必须是给定对齐值的倍数(从内存对象的开头开始计数)。

在您的情况下,一个大缓冲区可能更好(就浪费的内存空间而言):3 * 280 等于 840 以及所需内存大小和所需内存大小之间的相对差异您的缓冲区的大小可能会更小。

关于vulkan - 一个主机可见缓冲区而不是多个 - 我应该考虑一些对齐吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50862814/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com