glsl - 由单个 for 循环引起的奇怪的性能下降-6ren

glsl - 由单个 for 循环引起的奇怪的性能下降

转载作者：行者123 更新时间：2023-12-02 09:30:25

47

4

我目前正在 Linux(NVIDIA 360M 卡，带有 313.0 nv 驱动程序)上编写一个 OpenGL 3.1(带有 GLSL 版本 330)应用程序，大约有 15k 行。我的问题是，在我的一个顶点着色器中，通过对实际上应该是无操作的代码进行最小的更改，我可能会遇到性能急剧下降的情况。

例如:

// With this solution my program runs with 3-5 fps
for(int i = 0; i < 4; ++i) {
  vout.shadowCoord[i] = uShadowCP[i] * w_pos;
}

// But with this it runs with 30+ fps
vout.shadowCoord[0] = uShadowCP[0] * w_pos;
vout.shadowCoord[1] = uShadowCP[1] * w_pos;
vout.shadowCoord[2] = uShadowCP[2] * w_pos;
vout.shadowCoord[3] = uShadowCP[3] * w_pos;

// This works with 30+ fps too
vec4 shadowCoords[4];
for(int i = 0; i < 4; ++i) {
  shadowCoords[i] = uShadowCP[i] * w_pos;
}
for(int i = 0; i < 4; ++i) {
  vout.shadowCoord[i] = shadowCoords[i];
}

或者考虑一下:

uniform int uNumUsedShadowMaps = 4; // edit: I called this "random_uniform" in the original question

// 8 fps
for(int i = 0; i < min(uNumUsedShadowMaps, 4); ++i) {
    vout.shadowCoord[i] = vec4(1.0);
}

// 30+ fps
for(int i = 0; i < 4; ++i) {
  if(i < uNumUsedShadowMaps) {
    vout.shadowCoord[i] = vec4(1.0);
  } else {
    vout.shadowCoord[i] = vec4(0.0);
  }
}

在此处查看完整的着色器代码，其中出现了此问题: http://pastebin.com/LK5CNJPD

任何关于可能导致这些问题的想法都会受到赞赏。

最佳答案

我终于找到了问题的根源，也找到了解决办法。

但在直接找到解决方案之前，请让我粘贴最少的着色器代码，这样我就可以重现这个“错误”。

顶点着色器:

#version 330 

vec3 CountPosition(); // Irrelevant how it is implemented.

uniform mat4 uProjectionMatrix, uCameraMatrix;

out VertexData {
    vec3 c_pos, w_pos;
    vec4 shadowCoord[4];
} vout;

void main() {
    vout.w_pos = CountPosition();
    vout.c_pos = (uCameraMatrix * vec4(vout.w_pos, 1.0)).xyz;
    vec4 w_pos = vec4(vout.w_pos, 1.0);

    // 20 fps
    for(int i = 0; i < 4; ++i) {
        vout.shadowCoord[i] = uShadowCP[i] * w_pos;
    }

    // 50 fps
    vout.shadowCoord[0] = uShadowCP[0] * w_pos;
    vout.shadowCoord[1] = uShadowCP[1] * w_pos;
    vout.shadowCoord[2] = uShadowCP[2] * w_pos;
    vout.shadowCoord[3] = uShadowCP[3] * w_pos;

    gl_Position = uProjectionMatrix * vec4(vout.c_pos, 1.0);
}

<小时/>

片段着色器:

#version 330

in VertexData {
    vec3 c_pos, w_pos;
    vec4 shadowCoord[4];
} vin;

out vec4 frag_color;

void main() {
    frag_color = vec4(1.0);
}

<小时/>

有趣的是，只需对顶点着色器进行最小的修改即可使这两种解决方案都以 50 fps 的速度运行。 main函数应该修改为这样:

void main() {
    vec4 w_pos = vec4(CountPosition(), 1.0);
    vec4 c_pos = uCameraMatrix * w_pos;

    vout.w_pos = vec3(w_pos);
    vout.c_pos = vec3(c_pos);

    // 50 fps
    for(int i = 0; i < 4; ++i) {
        vout.shadowCoord[i] = uShadowCP[i] * w_pos;
    }

    // 50 fps
    vout.shadowCoord[0] = uShadowCP[0] * w_pos;
    vout.shadowCoord[1] = uShadowCP[1] * w_pos;
    vout.shadowCoord[2] = uShadowCP[2] * w_pos;
    vout.shadowCoord[3] = uShadowCP[3] * w_pos;

    gl_Position = uProjectionMatrix * c_pos;
}

区别在于上面的代码从着色器中读取变量，而底部的代码将这些值保存在临时变量中，并且只写入到变量中。

结论:

读取着色器的输出变化通常被视为一种优化，可以减少一个临时变量，或者至少我在互联网上的很多地方都看到过它。尽管存在上述事实，读取变化实际上可能是无效的 OpenGL 操作，并且可能使 GL 进入未定义状态，在这种状态下，代码中的随机更改可能会触发坏事情。

最好的一点是 GLSL 330 specification没有说任何关于从之前写入的输出变化中读取的内容。可能是因为这不是我应该做的事情。

<小时/>

附注

另请注意，原始代码中的第二个示例可能看起来完全不同，但在这个小代码片段中它的工作原理完全相同，如果读取输出变化，则 i < min(uNumUsedShadowMaps, 4) 会变得相当慢。作为 for 循环中的条件，但是如果仅写入输出变化，则不会对性能造成任何变化，并且 i < min(uNumUsedShadowMaps, 4)其中一个也能以 50 fps 运行。

关于glsl - 由单个 for 循环引起的奇怪的性能下降，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19433469/

47

4

0

文章推荐： ASP.NET 元 :resourcekey

文章推荐： module - 如何在组件中显示 Joomla 模块？

文章推荐： facebook - Google Analytics 自定义字段

文章推荐： eclipse - 在 Eclipse 中禁用 "Add Xtext nature"对话框

rust - 如何从Rayon的 `par_iter()`引起 panic ？
我正在尝试从par_iter()内部捕捉到 panic ，并继续执行par_iter块之后的操作。如果我有这个，我会正确地获得一切，并且不会出现 panic : let dog: Dog = Dog
java - NoClassDefFoundError 是否总是由 ClassNotFoundException 引起？
我可以假设从 JDK 类加载机制抛出的每个 NoClassDefFoundError 总是在堆栈跟踪中将 ClassNotFoundException 作为原因吗？另外，NoClassDefFoun
java - 由java.lang.NoClassDefFoundError :引起
我有下面的程序 package com; import java.io.PrintStream; import java.net.URL; import java.net.UR
java - NoClassDefFoundError: ... 由 ClassNotFoundException 引起
我有一些由另一组人编写的简单代码(目前不可用)，它引用了我得到的一些 jar 文件。当我编译代码时，一切都构建得很好，但是一旦代码尝试创建在其中一个 jar 文件中定义的类的实例，我就会收到 java
python - Airbrake-Django 引起 SSLError
我正在尝试按照 https://github.com/airbrake/airbrake-django#manually-sending-errors-to-airbrake 上的示例进行操作手动向
java - StackOverflowError 由 TableModelListener 引起
我不确定为什么这是递归的。 jTable1.getModel().addTableModelListener(new TableModelListener() { public void table
ruby - Cloudfoundry 升级错误 - 由 Chef 引起
我按照 https://github.com/cloudfoundry/vcap 上的自述文件进行操作它应该工作正常... 但我得到了这样的错误: 有谁知道发生了什么？我在 Ubuntu10.04
angularjs - 如何调试空白页错误(由 UI-Router 引起)？
我只是想知道当你有 UI-Router 的空白页面时，有人知道如何调试情况。 (当然，控制台没有任何错误) 通过为路由器事件执行 console.log(取自 here)，我发现它进入了正确的状态，但
Firefox "Bad request"由损坏的谷歌跟踪 cookie 引起
我们的网站上有一个问题，一些 Firefox 用户在访问我们的网站时会收到“错误请求”消息(仅此而已，只是“错误请求”字样!) 这似乎是由于 google 跟踪 cookie 损坏，可能是 __utm
rspec - 引起 “Error: can' t修改字符串的防护；暂时锁定”
在使用guard-rspec在Rails 4项目中运行guard时，在vim中打开/关闭文件时偶尔会看到以下错误。我试过升级/降级guard，guard-rspec，pry和其他没有运气的库。 rub
java - 由 :java. lang.ClassCastException 引起:
今天我在编写程序时遇到了这个错误。 Caused by:java.lang.ClassCastException: org.cubeville.blocks.CrossedBlockBrush can
java - NullPointerException 由 : task. 执行 (""引起)；
我在执行应用程序时遇到空指针异常，但我不确定原因。问题发生在线路上: task.execute(""); 但我不确定为什么会出现空指针异常。 (我已经验证我有互联网连接，并且它所连接的 XML
java - 写入临时目录由 : java. io.FileNotFoundException 引起
嗨，我有一个 java 应用程序，我正在尝试使用它写入 tempDir，但我仍然遇到以下异常。我承认我对编写文件不太了解，所以希望我缺少一些小东西。 Caused by: java.io.FileNo
java - 由 : java. util.ConcurrentModificationException 引起
我不明白为什么会发生这种情况。我对其他问题做了一些研究，发现使用 for 循环时无法修改集合。但是，我正在使用迭代器，为什么它不起作用？ int counter = 0; int otherC
apache - "RewriteEngine not allowed here"由父目录中的 htaccess 引起
目前我正在使用 OSX Server (Yosemite) 来托管一堆 PHP 应用程序，其中一些应用程序在网站文档根目录下有一个子目录用于子域。自更新到 Yosemite 版本的 OSX Serve
c# - 未将对象引用设置为对象实例由 DBNull.Value 引起
SqlCommand objsql = new SqlCommand(); . . objsql.Parameters.AddWithValue("@Param1", DBNull.Value); .
javafx 由 : java. lang.UnsupportedOperationException 引起
当我尝试将“对象”添加到数据库然后将其显示到 TableView 时，它显示 UnsupportedOperationException 。一切都很好，直到我将此代码添加到“public void i
java - 由 : java. lang.NullPointerException 引起
我收到以下错误日志: 05-29 20:57:29.886: D/AndroidRuntime(359): Shutting down VM 05-29 20:57:29.896: W/dalvikv
java - 由 : javax.naming.NamingException 引起
我有两个项目，第一个是Ejb3项目，名称是SessionBean，另一个是java项目，名称是SessionBeanClient。对于 IDE，我使用 eclipse indigo。我已经完成了代码，
c# - FormsAuthenticationTicket 不能在服务器端失效。引起 cookie 回复攻击
我有一个使用表单成员身份验证的 ASP.NET Web 应用程序。我们最近进行了渗透测试，标记的一个问题是窃取用户帐户的能力。如果 .ASPXAUTH cookie 值是在注销之前从用户复制的，用户可

首页

博学

6Ren·AI

商城

glsl - 由单个 for 循环引起的奇怪的性能下降

结论: