opengl - 在 nvidia opengl 上混合 glGetTexImage 和 imageStore 的问题-6ren

opengl - 在 nvidia opengl 上混合 glGetTexImage 和 imageStore 的问题

转载作者：行者123 更新时间：2023-12-01 15:37:36

36

4

我写了一些代码，太长无法粘贴到这里，它通过使用无绑定(bind) imageLoad 和 imageStore 的片段着色器渲染到 3D 1 组件浮点纹理。

该代码绝对有效。

然后我需要解决一些 GLSL 编译器错误，所以想通过 glGetTexImage 将上面的 3D 纹理读回主机。是的，我确实做了一个 glMemoryBarrierEXT(GL_ALL_BARRIER_BITS)。我确实通过 glGetTexLevelparameteriv() 检查了纹理信息，我看到的所有内容都匹配。我确实检查了 OpenGL 错误，但没有。

遗憾的是，glGetTexImage 似乎永远不会读取片段着色器写入的内容。相反，它只返回我在调用 glTexImage3D() 创建纹理时输入的假值。

这是预期的行为吗？文档另有暗示。

如果 glGetTexImage 实际上以这种方式工作，我如何才能读回该 3D 纹理中的数据(驻留在设备上？)显然，驱动程序可以像在使纹理成为非驻留时那样执行此操作。当然有一个简单的方法来做这个简单的事情...

我在问 glGetTexImage 是否应该以这种方式工作。这是代码:

void Bindless3DArray::dump_array(Array3D<float> &out)
{  
bool was_mapped = m_image_mapped;
if (was_mapped)
    unmap_array();          // unmap array so it's accessible to opengl

out.resize(m_depth, m_height, m_width);

glBindTexture(GL_TEXTURE_3D, m_textureid);  // from glGenTextures()

#if 0
int w,h,d;
glGetTexLevelParameteriv(GL_TEXTURE_3D, 0, GL_TEXTURE_WIDTH, &w);
glGetTexLevelParameteriv(GL_TEXTURE_3D, 0, GL_TEXTURE_HEIGHT, &h);
glGetTexLevelParameteriv(GL_TEXTURE_3D, 0, GL_TEXTURE_DEPTH, &d);
int internal_format;
glGetTexLevelParameteriv(GL_TEXTURE_3D, 0, GL_TEXTURE_INTERNAL_FORMAT, &internal_format);
int data_type_r, data_type_g;
glGetTexLevelParameteriv(GL_TEXTURE_3D, 0, GL_TEXTURE_RED_TYPE, &data_type_r);
glGetTexLevelParameteriv(GL_TEXTURE_3D, 0, GL_TEXTURE_GREEN_TYPE, &data_type_g);
int size_r, size_g;
glGetTexLevelParameteriv(GL_TEXTURE_3D, 0, GL_TEXTURE_RED_SIZE, &size_r);
glGetTexLevelParameteriv(GL_TEXTURE_3D, 0, GL_TEXTURE_GREEN_SIZE, &size_g);
#endif

glGetTexImage(GL_TEXTURE_3D, 0, GL_RED, GL_FLOAT, &out(0,0,0));
glBindTexture(GL_TEXTURE_3D, 0);
CHECK_GLERROR();

if (was_mapped)
    map_array_to_cuda();    // restore state
}

这是创建无绑定(bind)数组的代码:

void Bindless3DArray::allocate(int w, int h, int d, ElementType t)
{
if (!m_textureid)
    glGenTextures(1, &m_textureid);
m_type = t;
m_width = w;
m_height = h;
m_depth = d;

glBindTexture(GL_TEXTURE_3D, m_textureid);
CHECK_GLERROR();
glTexParameteri(GL_TEXTURE_3D, GL_TEXTURE_MIN_FILTER, GL_NEAREST);
glTexParameteri(GL_TEXTURE_3D, GL_TEXTURE_MAG_FILTER, GL_NEAREST);
glTexParameteri(GL_TEXTURE_3D, GL_TEXTURE_MAX_LEVEL, 0);    // ensure only 1 miplevel is allocated
CHECK_GLERROR();

Array3D<float> foo(d, h, w);
// DEBUG -- glGetTexImage returns THIS data, not what's on device
for (int z=0; z<m_depth; ++z)
for (int y=0; y<m_height; ++y)
for (int x=0; x<m_width; ++x)
    foo(z,y,x) = 3.14159;

//-- Texture creation
if (t == ElementInteger)
    glTexImage3D(GL_TEXTURE_3D, 0, GL_R32UI, w, h, d, 0, GL_RED_INTEGER, GL_INT, 0);
else if (t == ElementFloat)
    glTexImage3D(GL_TEXTURE_3D, 0, GL_R32F,  w, h, d, 0, GL_RED, GL_FLOAT, &foo(0,0,0));
else
    throw "Invalid type for Bindless3DArray";
CHECK_GLERROR();

m_handle = glGetImageHandleNV(m_textureid, 0, true, 0, (t == ElementInteger) ? GL_R32UI : GL_R32F);
glMakeImageHandleResidentNV(m_handle, GL_READ_WRITE);
CHECK_GLERROR();

#ifdef USE_CUDA
checkCuda(cudaGraphicsGLRegisterImage(&m_image_resource, m_textureid, GL_TEXTURE_3D, cudaGraphicsRegisterFlagsSurfaceLoadStore));
#endif
}

我分配数组，通过 OpenGL 片段程序渲染它，然后我调用 dump_array() 来读回数据。可悲的是，我只得到我在分配调用中加载的内容。

渲染程序看起来像

void App::clear_deepz()
{
deepz_clear_program.bind();

deepz_clear_program.setUniformValue("sentinel", SENTINEL);
deepz_clear_program.setUniformValue("deepz", deepz_array.handle());
deepz_clear_program.setUniformValue("sem", semaphore_array.handle());

run_program();

glMemoryBarrierEXT(GL_ALL_BARRIER_BITS);
//  glMemoryBarrierEXT(GL_SHADER_IMAGE_ACCESS_BARRIER_BIT);
//  glMemoryBarrierEXT(GL_SHADER_GLOBAL_ACCESS_BARRIER_BIT_NV);

deepz_clear_program.release();
}

片段程序为:

#version 420\n

in vec4 gl_FragCoord;
uniform float sentinel;
coherent uniform layout(size1x32) image3D deepz;
coherent uniform layout(size1x32) uimage3D sem;

void main(void)
{
ivec3 coords = ivec3(gl_FragCoord.x, gl_FragCoord.y, 0);
imageStore(deepz, coords, vec4(sentinel));
imageStore(sem, coords, ivec4(0));
discard;    // don't write to FBO at all
}

最佳答案

discard;    // don't write to FBO at all

discard 不是这个意思。哦，确实是这个意思。但它也意味着所有图像加载/存储写入也将被丢弃。事实上，编译器很可能会看到该语句并且对整个片段着色器什么都不做。

如果你只想执行片段着色器，你可以使用 GL 4.3 特性(在你的 NVIDIA 硬件上可用)有一个 empty framebuffer object .或者你可以使用 compute shader .如果您还不能使用 GL 4.3，请使用 write mask关闭所有颜色写入。

关于opengl - 在 nvidia opengl 上混合 glGetTexImage 和 imageStore 的问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16969802/

36

4

0

文章推荐： coq - Isabelle/HOL Isar 中错误假设的证明

文章推荐： java - Android CursorWindow 仅返回 1 行、1 列

文章推荐： java - 如何从 Windows API(Java 中)登录用户？

文章推荐： build.gradle 中的 gradle 任务方法语法

c++ 将 printf 与 wprintf 混合(或将 cout 与 wcout 混合)
我知道您不应该将打印与 printf,cout 和 wprintf,wcout 混合使用，但是很难找到一个好的答案，为什么以及是否可以绕过它。问题是我使用了一个用 printf 打印的外部库，而我自己
Python多重继承/混合
我有以下问题: class A: animal = 'gerbil' def __init__(self): self.result = self.calculate_
OpenGL 混合 - 用不同的颜色填充交叉点
我在屏幕上渲染了一堆形状(多边形)，我没有使用深度测试。我只是希望这些形状在绘制在空白区域时使用自己的颜色，并且在绘制到任何非空区域时使用红色像素，即在我的情况下绘制在另一个多边形上。这里的问题实
grails - Groovy 混合？
我正在尝试在我的 Groovy/Grails 应用程序中混入一个类，我正在使用 the syntax defined in the docs ，但我不断收到错误消息。我有一个如下所示的域类: cla
OpenGL Alpha 混合
我已经找到了 5349574673 个关于 Alpha 混合的页面，但我仍然无法获得想要的结果。我正在尝试使用 opengl 使 gif/png 文件正确显示(具有透明度/半透明度)。这是我的初始化
javascript - 记录通过函数生成的类(混合)
我正在尝试记录以下代码，但我似乎无法让 JSDoc 记录该类，甚至无法引用它的存在。 // SomeMixin.js export default superclass => class SomeMi
scala - 家庭多态性+混合？
我有一个类型家族，我想使用 mixin 以模块化方式“丰富”它们。例如: trait Family { self => trait Dog { def dogname:String
ios - 混合 Storyboard中的单元和以编程方式创建的单元
我在 Storyboard中有 Collection View 。我在 Storyboard中有一部分单元格，还有我以编程方式创建的部分单元格。我应该在 sizeForItemAtIndexPath
c++ - 混合/修改数组访问
我有一个字节数组，我想更改它的访问方式。这是数组: char bytes[100]; 我想要另一个数组来改变原始数组的访问方式。如果我们可以将引用放在数组中，它看起来像这样: char& bytes_
c++ - c和c++混合
我需要从 c 文件调用 cpp 方法。我为此编写了这个界面.. cpp文件 extern "C" void C_Test(int p){ Class::CPP_Test(p); } c文件
移动和主要 CSS 混合
我的网站有两份 CSS 表，一份是主 CSS，一份是移动 CSS。问题是在移动设备(iPhone、Android)上查看时，两个样式表会混淆。例如，在 iPhone 上查看网站时，会应用主样式表中的某
Python Bokeh - 混合
维护人员的说明:此问题涉及已过时的 bokeh.charts API，该 API 已于多年前删除。有关使用现代 Bokeh 创建各种条形图的信息，请参阅: https://docs.bokeh.org
ios - 从另一个层中减去层，混合？
在下图中，蓝色圆圈仅用于调试目的。我的目标是蓝色圆圈后面的每一层都应该是透明的。我只想保持蓝色圆圈外面的可见。这是用 swift 编写的代码: let croissantView = UIV
SQL - 混合 AND 和 OR
我不是 SQL 专家。我正在使用 SQL Server 2005，我正在尝试弄清楚如何构造一个查询，以便它可以满足多种要求。我有两个表定义如下: Classroom - ID - Departme
完全不透明或透明的 openGL Alpha 混合
原创: 我之前问过这个问题，但我最初的例子有点不完整，我想我现在可以更具体地说明我的问题。对于上下文，我在旧的 Apple mac 计算机上使用 openGL 3.3 并尝试渲染四边形的重叠层。每个
YAML:将内联与同一对象的常规 map 混合
是否可以将内联(类似 json)映射与同一对象的常规映射定义混合使用？考虑以下示例: person: {age: 32, weight: 82} name: foo 生成的人应具有给定的年龄、体
inheritance - 如何在子类中将多个父类构造函数与 val 混合
假设我有一个 Parent 类，它有四个字段 A、B、C 和 D，这样 C 和 D 可以选择传递或使用默认实现进行初始化: open class Parent(val a: A, val b: B,
svn - 将存储库与 SVN 混合
我正在使用 symphony (1.4) 框架在 PHP 中开发一个 Web 应用程序。该代码使用 SVN 进行版本控制。在此网络应用程序中，我们所有客户共享一个共同的基础，以及一些专门为每个客户创建
Qt 小部件与顶部的 QML 混合
我想使用两个小部件(一次一个)作为我的应用程序的基础/背景，上面有一个 QML UI 和一个无边框窗口。它应该看起来像这样: 基于 OpenGL 的扫描组件通过窗口句柄操作的 3D 可视化组件多个
javascript - 混合 Angular 应用程序中的变化检测非常慢
我们有一个混合的 AngularJS/Angular 8 应用程序，并且我们不断遇到来自不同版本框架的组件之间的变化检测非常慢的问题。到目前为止，我们只在 Angular 组件中使用 AngularJ

首页

博学

6Ren·AI

商城

opengl - 在 nvidia opengl 上混合 glGetTexImage 和 imageStore 的问题