- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
有没有办法将 GPU 上运行的着色器的结果返回到 CPU 上运行的程序?
我想根据 GPU 上计算成本较高的算法从简单体素数据生成多边形网格,但我需要 CPU 上的结果进行物理计算。
最佳答案
定义“结果”?
一般来说,如果您使用 OpenGL 进行 GPGPU 式计算,则需要围绕渲染系统的需求构建着色器。渲染系统被设计为单向的:数据进入其中并生成图像。回顾过去,让渲染系统生成数据通常并不是渲染系统的结构方式。
当然,这并不意味着您做不到。但您需要围绕 OpenGL 的限制来构建一切。
OpenGL 提供了许多 Hook ,您可以在其中从某些着色器阶段写入数据。其中大多数需要专门的硬件
任何支持片段着色器的硬件显然都允许您写入正在渲染的当前帧缓冲区。通过使用framebuffer objects以及浮点或整数纹理 image formats ,您几乎可以将任何您想要的数据写入各种图像。一旦进入纹理,您只需调用 glGetTexImage
获取渲染后的像素数据。或者你也可以这样做glReadPixels
如果 FBO 仍处于绑定(bind)状态,则获取它。无论哪种方式都有效。
此方法的主要局限性是:
可以附加到帧缓冲区的图像数量;这限制了您可以写入的数据量。在 GL 3.x 之前的硬件上,FBO 通常仅限于 4 个图像加上一个深度/模板缓冲区。在 3.x 及更好的硬件中,您至少可以期待 8 个图像。
您正在渲染的事实。这意味着您需要设置顶点数据以将三角形精确定位在您希望其修改数据的位置。这不是一件小事。获得有用的输入数据也很困难,因为您通常希望每个纹理像素彼此相当独立。围绕这些限制构建片段着色器是很困难的。并非不可能,但在许多情况下并非微不足道。
此 OpenGL 3.0 功能允许 Vertex Processing 的输出OpenGL 阶段(顶点着色器和可选的几何着色器)要在一个或多个缓冲区对象中捕获。
这对于捕获您想要使用或再次渲染的顶点数据来说更加自然。在您的情况下,您需要在渲染后将其读回,可能使用 glGetBufferSubData
调用,或者使用 glMapBufferRange
进行读取。
这里的限制是您通常只能捕获 4 个输出值,其中每个值都是 vec4。还有一些严格的布局限制。一些 OpenGL 3.x 和 4.x 硬件提供了将数据写入多个反馈流的能力,这些反馈流都可以写入不同的缓冲区。
这个 GL 4.2 功能代表了写入的巅峰:您可以绑定(bind)图像(缓冲区纹理,如果您想写入缓冲区),然后直接写入它。有memory ordering constraints您需要在其中工作。
它非常灵活,但也非常复杂。除了正确使用它的困难之外,它还存在许多限制。您可以写入的图像数量相当有限,可能是 8 个左右。并且实现可能有总写入限制,因此要写入的 8 个图像可能必须由片段着色器的输出共享。
此外,仅保证片段着色器(以及 4.3 的计算着色器)的图像输出。也就是说,硬件可以禁止您在非 FS/CS 着色器阶段使用图像加载/存储。
关于opengl - 在OpenGL中将GPU计算的结果返回给CPU程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14086926/
在 OpenGL/ES 中,在实现渲染到纹理功能时,您必须小心,不要引起反馈循环(从正在写入的同一纹理中读取像素)。由于显而易见的原因,当您读取和写入纹理的相同像素时,行为是未定义的。但是,如果您正在
正如我们最终都知道的那样,规范是一回事,实现是另一回事。大多数错误是我们自己造成的,但有时情况并非如此。 我相信列出以下内容会很有用: GPU 驱动程序中当前已知的与最新版本的 OpenGL 和 GL
很难说出这里问的是什么。这个问题是模棱两可的、模糊的、不完整的、过于宽泛的或修辞的,无法以目前的形式得到合理的回答。为了帮助澄清这个问题以便可以重新打开它,visit the help center
我正在学习 OpenGL,非常想知道与显卡的交互如何。 我觉得了解它是如何在图形驱动程序中实现的,会让我了解 opengl 的完整内部结构(通过这个我可以知道哪些阶段/因素影响我对 opengl 性能
我正在尝试绘制到大于屏幕尺寸(即 320x480)的渲染缓冲区 (512x512)。 执行 glReadPixels 后,图像看起来是正确的,除非图像的尺寸超过屏幕尺寸——在本例中,超过 320 水平
我正在 Windows 中制作一个 3D 小行星游戏(使用 OpenGL 和 GLUT),您可以在其中穿过一堆障碍物在太空中移动并生存下来。我正在寻找一种方法来针对无聊的 bg 颜色选项设置图像背景。
如果我想要一个包含 100 个 10*10 像素 Sprite 的 Sprite 表,是否可以将它们全部排成一排来制作 1,000*10 像素纹理?还是 GPU 对不那么窄的纹理表现更好?这对性能有什
这个问题在这里已经有了答案: Rendering 2D sprites in a 3D world? (7 个答案) 关闭 6 年前。 我如何概念化让图像始终面对相机。我尝试将三角函数与 arcta
是否可以在 OpenGL 中增加缓冲区? 假设我想使用实例化渲染。每次在世界上生成一个新对象时,我都必须用实例化数据更新缓冲区。 在这种情况下,我有一个 3 个 float 的缓冲区 std::v
有人可以向我解释为什么下面的代码没有绘制任何东西,但如果我使用 GL_LINE_LOOP 它确实形成了一个闭环吗? glBegin(GL_POLYGON); for(int i = 0; i <= N
正如标题所说,OpenGL 中的渲染目标是什么?我对 OpenGL 很陌生,我看到的所有网站都让我很困惑。 它只是一个缓冲区,我在其中放置稍后将用于渲染的东西吗? 如果您能提供一个很好的引用来阅读它,
当使用 OpenGL 1.4 固定功能多纹理时,每个纹理阶段的输出在传递到下一个阶段之前是否都固定在 [0, 1]? spec说(第 153 页): If the value of TEXTURE_E
我比较了 2 个函数 openGL ES 和 openGL gvec4 texelFetchOffset(gsampler2DArray sampler, ivec3 P, int lod, ivec
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 10 年前。 Improve thi
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 6年前关闭。 Improve this qu
那么当你调用opengl函数时,比如glDraw或者gLBufferData,是否会导致程序线程停止等待GL完成调用呢? 如果不是,那么 GL 如何处理调用像 glDraw 这样的重要函数,然后立即更
我正在尝试实现级联阴影贴图,当我想访问我的视锥体的每个分区的相应深度纹理时,我遇到了一个错误。 更具体地说,当我想选择正确的阴影纹理时会出现我的问题,如果我尝试下面的代码,我会得到一个像 this 中
我想为OpenGL ES和OpenGL(Windows)使用相同的着色器源。为此,我想定义自定义数据类型并仅使用OpenGL ES函数。 一种方法是定义: #define highp #define
我尝试用 6 个位图映射立方体以实现天空盒效果。我的问题是一个纹理映射到立方体的每个面。我已经检查了 gDEBugger,在立方体纹理内存中我只有一个 图像(因为我尝试加载六个图像)。 代码准备纹理:
在 OpenGL 中偏移深度的最佳方法是什么?我目前每个多边形都有索引顶点属性,我将其传递给 OpenGL 中的顶点着色器。我的目标是在深度上偏移多边形,其中最高索引始终位于较低索引的前面。我目前有这
我是一名优秀的程序员,十分优秀!