opengl - 我是否应该在统一缓冲区或着色器存储缓冲区对象内使用 `vec3`？-6ren

opengl - 我是否应该在统一缓冲区或着色器存储缓冲区对象内使用 `vec3`？

转载作者：太空宇宙更新时间：2023-11-04 12:30:21

25

4

vec3类型是非常好的类型。它仅占用3个浮点数，而我的数据仅需要3个浮点数。我想在UBO和/或SSBO的结构中使用一个:

layout(std140) uniform UBO
{
  vec4 data1;
  vec3 data2;
  float data3;
};

layout(std430) buffer SSBO
{
  vec4 data1;
  vec3 data2;
  float data3;
};

然后，在我的C或C++代码中，我可以这样做来创建匹配的数据结构:

struct UBO
{
  vector4 data1;
  vector3 data2;
  float data3;
};

struct SSBO
{
  vector4 data1;
  vector3 data2;
  float data3;
};

这是一个好主意吗？

最佳答案

不! 永远不要这样做!

在声明UBO / SSBO时，假装所有3元素 vector 类型都不存在。这包括具有3行的列主矩阵或具有3列的行主矩阵。假设唯一的类型是标量，2和4个元素 vector (和矩阵)。如果这样做，您将为自己节省很多悲痛。

如果要使用vec3 +浮点效果，则应手动打包:

layout(std140) uniform UBO
{
  vec4 data1;
  vec4 data2and3;
};

是的，您必须使用 data2and3.w来获取其他值。处理它。

如果要使用 vec3数组，则使它们成为 vec4数组。使用3元素 vector 的矩阵也是如此。只需消除SSBO / UBO中3元素 vector 的整个概念即可；从长远来看，您会过得更好。

您应该避免使用 vec3的原因有两个:

它不会做C / C++的工作

如果使用 std140布局，则可能要用C或C++定义与GLSL中的定义匹配的数据结构。这使得两者之间的混合和匹配变得容易。而且 std140布局在大多数情况下至少可以做到这一点。但是，就 vec3而言，其布局规则与C和C++编译器的常规布局规则不匹配。

请考虑以下 vec3类型的C++定义:

struct vec3a { float a[3]; };
struct vec3f { float x, y, z; };

这两个都是完全合法的类型。这些类型的 sizeof和布局将匹配 std140所需的大小和布局。但是它与 std140施加的对齐方式不匹配。

考虑一下:

//GLSL
layout(std140) uniform Block
{
    vec3 a;
    vec3 b;
} block;

//C++
struct Block_a
{
    vec3a a;
    vec3a b;
};

struct Block_f
{
    vec3f a;
    vec3f b;
};

在大多数C++编译器上， sizeof和 Block_a的 Block_f将均为24。这意味着 offsetof b将为12。

但是，在std140布局中， vec3始终与4个单词对齐。因此， Block.b的偏移量为16。

现在，您可以尝试使用C++ 11的 alignas功能(或C11的类似 _Alignas功能)来解决此问题:

struct alignas(16) vec3a_16 { float a[3]; };
struct alignas(16) vec3f_16 { float x, y, z; };

struct Block_a
{
    vec3a_16 a;
    vec3a_16 b;
};

struct Block_f
{
    vec3f_16 a;
    vec3f_16 b;
};

如果编译器支持16字节对齐，则可以使用。或者至少在 Block_a和 Block_f的情况下可以使用。

但这在这种情况下不起作用:

//GLSL
layout(std140) Block2
{
    vec3 a;
    float b;
} block2;

//C++
struct Block2_a
{
    vec3a_16 a;
    float b;
};

struct Block2_f
{
    vec3f_16 a;
    float b;
};

根据 std140的规则，每个 vec3必须以16字节为边界。但是 vec3不会占用16个字节的存储空间。它仅消耗12。由于 float可以从4字节边界开始，因此 vec3后跟 float将占用16个字节。

但是C++对齐的规则不允许这样的事情。如果类型与X字节边界对齐，则使用该类型将消耗X字节的倍数。

因此，匹配 std140的布局要求您根据使用的确切位置选择一种类型。如果后面跟着 float，则必须使用 vec3a；如果后面跟着超过4个字节对齐的某种类型，则必须使用 vec3a_16。

或者，您不能只在着色器中使用 vec3，而避免所有这些增加的复杂性。

请注意，基于 alignas(8)的 vec2将不会出现此问题。 C / C++结构和数组也不会使用适当的对齐说明符(尽管较小类型的数组有其自身的问题)。仅当使用裸 vec3时，才会出现此问题。

实施支持模糊

即使您做对了所有事情，也已经知道实现会错误地实现 vec3的奇数布局规则。一些实现有效地将C++对齐规则强加给GLSL。因此，如果使用 vec3，它将像对待C++那样对待16字节对齐类型一样。在这些实现中， vec3后跟 float将像 vec4后跟 float一样工作。

是的，这是实施者的错。但是由于无法修复实现，因此您必须解决它。而最合理的方法是完全避免使用 vec3。

请注意，对于Vulkan(以及使用SPIR-V的OpenGL)，SDK的GLSL编译器可以实现此目的，因此您不必为此担心。

关于opengl - 我是否应该在统一缓冲区或着色器存储缓冲区对象内使用 `vec3`？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58902864/

25

4

0

文章推荐： css - 通过应用 css 类名增加 magento 站点中搜索词的大小

文章推荐： css - 使用负值无法在 SASS 中执行

logic - 前向链接一阶逻辑(统一)
我正在为期末考试学习，但我无法理解这个 FC 算法: 我理解你标准化每条规则的部分。然后我认为下一行是说对于满足广义 Modus Ponens (p'_iTheta = p_iTheta) 的每个 t
unity3d - 统一，如何使摩擦与运动一起工作
我有一个 3d 世界，它有一个 simpel 平台和一个代表玩家的立方体。当我旋转平台时，立方体会滑动并按照您预期的方式执行，增加和减少物理 Material 中的摩擦力。我希望立方体在输入例如 f
unity3d - 加载我的场景时发生未知错误。统一
所以我的 Unity 项目有一个大问题。我昨天工作，我没有做备份今天，在我打开项目后，我的笔记本电脑因电池电量不足而关机。之后，当我进入项目时，我得到了这个:加载“Assets/MyScene.uni
haskell - 列表推导中的“统一”
好的，我正在尝试创建一个函数来确定元组列表是否是可传递的，即如果 (x,y) 和 (y,z) 在列表中，那么 (x,z) 也在列表中。例如，[(1,2), (2,3), (1,3)]是传递的。现在
c# - 移动窗口切换时如何保持时间引用？ (统一)
这个问题在这里已经有了答案: How to pass data between scenes in Unity (5 个回答) 9 个月前关闭。我有一个游戏，我有一个队列匹配系统。我想向玩家展示他
java - JDK目录未设置或无效(统一)？
我现在正在为我的游戏创建一个 keystore (统一)但是当我按下添加键按钮时，会弹出一个错误 Java Development Kit (JDK) directory is not set or
android - Cardboard的YouTube视频流(统一)
我想将YouTube流视频放入Cardboard(适用于Android和iOS)应用中。我知道这些插件可以执行类似的操作，例如“Easy Movie Texture”，但它们不支持YouTube流媒体
unity3d - 统一。关节角度限制是什么意思？
我需要限制 ConfigurableJoint 的目标旋转以避免关节变形或破坏。为了了解角度限制的工作原理，我做了一个实验。在场景中放置一个人形模型。为骨骼添加ConfigurableJoint
regex - 人工智能匹配，统一
尝试实现一种有限形式的匹配统一。尝试匹配两个公式匹配如果我们能找到替代出现在公式中的变量使得两者在句法上是等价。我需要写一个函数来判断一个对应于基本项的常数，例如 Brother(George)
c# - 用电子邮件发送日志文件？统一
我正在使用 Unity 和 C#我想在运行时将输出日志文件发送到我的电子邮件，我使用了来自 this question 的 ByteSheep 答案和来自 this question 的 Arkane
c# - 统一，加电碰撞问题
关闭。这个问题需要debugging details .它目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and th
c# - 如何在单击游戏对象时创建菜单？ (统一)
我希望能够将鼠标悬停在游戏对象(代理)上并在右键或左键单击时创建一个类似于 Windows 右键单击菜单的 float 菜单。我试过结合使用 OnGUI() 和 OnMouseOver() 但我要
c# - 统一 - 在特定时间后改变场景
我正在为 oculus Gear VR 开发游戏(考虑内存管理)，我需要在特定时间(以秒为单位)后加载另一个屏幕 void Start () { StartCoroutine (loadSce
javascript - 统一/如何设置敌人生成的限制？
我设法生成了敌人，但它们一直在生成。如何设置限制，避免不断生成？我已经尝试添加 spawnLimit 和 spawnCounter 但无法让它工作。 var playerHealth = 100;
c# - 统一(对象名称与游戏对象)
我正在参加使用 Unity 进行游戏开发的在线类(class)，讲师有时会含糊不清。我的印象是使用游戏对象与使用游戏对象名称(在本例中为 MusicPlayer)相同，但是当我尝试将 MusicPla
c# - 统一;随机物体运动
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 6 年前。 Improve this qu
java - 统一 - 无限的结果
为了好玩，我正在(用 Java)开发一个使用统一算法的应用程序。我选择了我的统一算法返回所有可能的统一。例如，如果我尝试解决添加(X，Y)=成功(成功(0)) 返回 {X = succ(succ(
c# - 统一。一定时间后的函数调用
如何让对象在一段时间后不可见(或只是删除)？使用 NGUI。我的示例(更改): public class scriptFlashingPressStart : MonoBehaviour {
c# - 找不到类型或命名空间名称 'NUnit' |统一
我有下一个错误: The type or namespace name 'NUnit' could not be found (are you missing a using directive or
android - 如何以编程方式将 autoSizeTextType 统一？
这是可以做到的但是属性 autoSizeTextType 只能用于 API LEVEL >= 26，并且 Android Studio 会显示有关该问题的烦人警告。为了摆脱这个问题，我想以编程方

首页

博学

6Ren·AI

商城

opengl - 我是否应该在统一缓冲区或着色器存储缓冲区对象内使用 `vec3`？