gpt4 book ai didi

opengl - 使用 OpenGL 进行高效的 GPU 随机内存访问

转载 作者:行者123 更新时间:2023-12-04 14:32:52 27 4
gpt4 key购买 nike

让 GPU 有效计算“反功能”例程的最佳模式是什么,这通常取决于定位内存写入而不是读取?
例如。例如计算直方图、排序、将数字除以百分比、将不同大小的数据合并到列表中等。

最佳答案

已建立的术语是收集读取和分散写入

收集阅读

这意味着您的程序将写入固定位置(如片段着色器的目标片段位置),但可以快速访问任意数据源(纹理、制服等)。

分散写入

这意味着,程序接收输入数据流,它不能任意寻址,但可以快速写入任意内存位置。

显然,OpenGL 的着色器架构是一个聚集系统。最新的 OpenGL-4 还允许在片段着色器中进行一些分散写入,但它们很慢。

那么,现在用 OpenGL 模拟“散射”的最有效方法是什么?到目前为止,这是使用对像素大小的点进行操作的顶点着色器。您可以发送尽可能多的数据点来处理并通过相应地设置它们的位置将它们分散在目标内存中。您可以使用几何和曲面分割着色器来生成在顶点单元中处理的点。您可以使用纹理缓冲区和 UBO 进行数据输入,使用顶点/点索引进行寻址。

关于opengl - 使用 OpenGL 进行高效的 GPU 随机内存访问,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9440721/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com