gpt4 book ai didi

c - glVertexAttribPointer、交错元素和性能/缓存友好性

转载 作者:行者123 更新时间:2023-12-02 00:32:00 24 4
gpt4 key购买 nike

因此,在为我正在处理的 3D 场景编写模型加载器的过程中,我决定像这样打包顶点、纹理和法线数据:

VVVVTTTNNN

对于每个顶点,其中 V = 顶点坐标,T = UV 坐标,N = 法线坐标。当我将此数据传递到场景的顶点着色器时,我进行了三个 glVertexAttribPointer 调用,如下所示:

glVertexAttribPointer(ATTRIB_VERTEX, 4, GL_FLOAT, 0, 10, group->vertices.data);
glEnableVertexAttribArray(ATTRIB_VERTEX);

glVertexAttribPointer(ATTRIB_NORMAL, 3, GL_FLOAT, 0, 10, group->normals.data);
glEnableVertexAttribArray(ATTRIB_NORMAL);

glVertexAttribPointer(ATTRIB_UV_COORDINATES, 3, GL_FLOAT, 0, 10, group->uvcoordinates.data);
glEnableVertexAttribArray(ATTRIB_UV_COORDINATES);

传递的每个组指针都指向该顶点类型开始的共享顶点数据 block 中的起始位置:

group->vertices.data == data
group->uvcoordinates.data == &data[4]
group->normals.data == &data[7]

我交织此数据的部分原因是为了缓存友好性进行编程并尽量减少发送到卡的数据。 (注意:这不是针对现实的性能瓶颈。我正在研究优化,因为我想了解更多有关编程的知识以解决此类问题。)但是,对于我的一生,我无法想象 GL 会如何能够推断出这 3 个不同的指针指向同一个较大数据 block 中的偏移位置,从而进行必要的优化以避免在数据已经被复制后复制数据。此外,由于我只是确保系统内存中的数据局部性(并没有真正保证数据将如何在 GPU 上组织),所以我只是在我访问任何的情况下真正优化这些顶点在 GL 之外。那正确吗?这些优化大部分是无用的,还是以这种方式提供数据有助于最大限度地减少到 GPU 的数据传输/防止在顶点着色器中遍历顶点数据时缓存未命中?

最佳答案

OpenGL只是一个API,智能在于驱动。无论如何,这个问题实际上实现起来相当简单:对于每个顶点属性,您都有一个起始内存地址,并且在调用 glDrawArrays 或 glDrawElements 时寻找找到的最大索引。这定义了范围的上限。

然后您对顶点属性起始地址进行排序,并为每个地址检查它的范围是否与任何其他顶点属性范围重叠。您找到相邻区域并复制它们。

在顶点缓冲区对象的情况下,它甚至更简单,因为您已经将内容复制到 OpenGL 准备好进行处理。

关于c - glVertexAttribPointer、交错元素和性能/缓存友好性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6385838/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com