gpt4 book ai didi

c++ - SSBO 的内容在 C++ 函数调用后变得无效

转载 作者:塔克拉玛干 更新时间:2023-11-03 06:43:22 27 4
gpt4 key购买 nike

我有一个名为 sparseMatrix 的 SSBO 以及以下操作顺序:

void callerFunc()
{
func1();
func2();
}

/* Clear buffer data store and fill with compute shader */
void func1()
{
glBindBufferBase(GL_SHADER_STORAGE_BUFFER, 1, sparseMatrix);
GLfloat floatZero = 0.0f;
glClearBufferSubData(GL_SHADER_STORAGE_BUFFER, GL_R32F, **EDIT: 0**, sizeof(GLfloat)*size, GL_RED, GL_FLOAT, &floatZero);

/* use shader program, bind uniforms */
glDispatchCompute(numWorkGroups,1,1); // fills buffer by adding a few numbers
}

/* Download data store contents and print */
void func2()
{
glBindBuffer(GL_SHADER_STORAGE_BUFFER, sparseMatrix);
GLfloat* temp = new GLfloat[size];
glGetBufferSubData(GL_SHADER_STORAGE_BUFFER, 0, sizeof(GLfloat)*size, temp);
/* print values to console */
}

func1()func2() 之间没有调用。

打印到控制台的值是垃圾(每个 float 都是 -107374176.000000)。我在两台机器上对此进行了测试,一台配备 GeForce GTX 570,另一台配备 GeForce GT 750M,结果完全相同,包括以下改动。驱动版本为 335.23。

我尝试对代码进行以下所有更改(每个更改分别进行):

  • 如果我将 func2() 的内容移动到 func1() 的末尾,结果结果很好。
  • 如果我将 func2() 的内容直接移动到 callerFunc() 中,结果结果很好。
  • 如果我在 func1() 末尾对 SSBO 添加额外的 glGetBufferSubData() 调用,则 func2() 中的值查询> 结果很好。
  • 如果我在 glClearBuffer 调用之后或 func1() 的末尾放置一个 glFinish() 中的值func2() 是正确的。如果我将 glFinish() 放在 func2() 的开头,它不会改变任何东西。
  • glMemoryBarrier(GL_SHADER_STORAGE_BARRIER_BIT) 放在任何地方也无济于事。

有人对这种奇怪的行为有解释吗?

编辑: 我用计算机着色器替换了对 glClearBufferSubData(...) 的调用,该计算机着色器用常量值填充数据存储,现在的行为是预期的。但我仍然不知道是什么导致了这个问题。

编辑 2: 感谢您的回答,但实际上我使用正确。当我在这里发布代码时,我忘记输入偏移参数,对此感到抱歉:( 我在另一个长长的连续计算调度列表中再次遇到了这个问题。我尝试了很多东西,最后它帮助设置了一个 GL_TEXTURE_FETCH_BARRIER_BIT 内存屏障而不是 GL_SHADER_STORAGE_BARRIER_BIT 屏障,尽管计算着色器纯粹在 SSBO 上工作。我不知道为什么。

最佳答案

错误在于你的使用方式

glClearBufferSubData

函数。

只看规范:

glClearBufferSubData

你基本上没有提供偏移量,我猜你为什么没有得到任何编译器错误,因为你缺少一个参数

代码示例:

GLfloat zeroFloat = 0.0f;

glClearBufferSubData(GL_SHADER_STORAGE_BUFFER, //target
GL_R32F, //internal format
0, //you were missing this: offset
sizeof(GLfloat)*size, //size
GL_RED, //format
GL_FLOAT, //type
&zeroFloat); //data

编辑答案以反射(reflect)评论中的要求:

GPU 可能会在管道的不同级别使用缓存,因此 BufferObject 中的更改不会立即从管道的其他阶段可见。内存屏障强制指定目标的一致性,以便屏障之前的每个写入操作在屏障之后都是可见的。如果您在屏障之后有任何写操作,那么您就有麻烦了。

write
Memory Barrier
read

您提到了长时间的计算,那么(假设没有驱动程序错误)SSBO 的当前内容可能取决于纹理。因此纹理上的内存屏障确保 SSBO 的内容具有纹理数据。然后似乎不需要 SSBO 上的内存屏障,因为当访问 SSBO 时它已经具有正确的数据(在这种情况下,理论上您需要设置纹理和 SSBO 位:更新 SSBO 之前的纹理屏障,以及使用它之前的 SSBO 屏障)。

如果您可以使用少量代码重现该问题,则它可能是驱动程序错误。请记住在具有不同硬件的多台机器上测试代码,因为由于缺少内存屏障,您仍然可能得到意想不到的结果。

关于c++ - SSBO 的内容在 C++ 函数调用后变得无效,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25229645/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com