- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
不久前,我正在尝试使用 GLSL 在 GPU 上创建一个重型声音合成器。该合成器能够同时产生超过 256 个声音的非常复杂的声音。在CPU上,我不敢梦想得到这样的性能。
(简化解释)为了生成声音,我有一个 NxV 大小的浮点纹理。 N = 样本数,V = 语音数。合成着色器为每个纹素生成值。
然后,第二个着色器会将所有声音混合在 16 位有符号整数 1D 纹理(或声卡所需的任何格式)中。使用像素缓冲区将最终纹理尽快复制到系统内存,然后将其发送到声卡。
对于声音,我使用超低延迟的 Windows Core Audio。
我编写了一个 MIDI 接口(interface),能够在连接到 PC 的 MIDI 键盘上播放,并且在使用 Intel GPU 时完美运行,延迟仅为 3ms(N = 132 个样本,这比所需的要好得多) 15-20ms N=600-900 个样本)。但当使用 NVidia GPU 来支持更繁重的计算时,延迟会更大(>35ms N=>1500 个样本)。
据我所知,原因是当使用Intel GPU时,渲染是直接在系统内存上完成的,并且复制纹理的速度非常快,但是当使用NVidia GPU时,渲染是在视频内存中完成并从视频复制的内存到系统内存是一个瓶颈,尽管它只需要传输大约 4KB 的音频数据(这甚至没有接近硬件应有的 6GB/s 能力)。
有没有办法改善这个问题?例如,是否可以让 NVidia GPU 直接渲染到系统内存(以可接受的速度),或者他们在 OpenCL 中谈论的那些著名的共享内存是什么? OpenCL 会改善这一点吗? (我没有 OpenCL 经验)
最佳答案
有时 GPU 写入主内存比 CPU 读取 VRAM 更快。这样做的方法是使用 PBO,看看 here 。您必须提示将 PBO 存储在主内存中。这可能有帮助,也可能没有帮助,具体取决于硬件架构。
OpenCL 本质上并不是更快。如果您在 OpenGL 中有一个干净的实现,那么您很可能不会通过 OpenCL 实现获得速度提升。但有些事情在 OpenCL 中可以做到,但在 OpenGL 中却无法做到。
如果您仍然发现带宽是瓶颈,还有其他一些建议:
您是否尽可能避免阻塞?当您在线程中使用 GL 调用读取纹理时,您是否也在另一个线程中处理最后读取的纹理,类似这样的事情。请注意,对 glGetTexImage 的调用是异步的,并且不会阻塞。只有在调用 glMapBuffer 之前,您才会阻塞并知道传输已完成。
您是否转移了尽可能少的转移、最少的转移次数。
有些压缩纹理格式是有损的,但也许适合您的需求?
关于audio - 优化显存和系统内存之间的传输,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29260126/
我有这个代码: System.err.print("number of terms = "); System.out.println(allTerms.size()); System.err
我有以下问题:在操作系统是 Linux 的情况下和在操作系统是 MacOs 的情况下,我必须执行不同的操作。 所以我创建了以下 Ant 脚本目标: /u
我正在调用 system("bash ../tools/bashScript\"This is an argument!\"&"),然后我正在调用 close(socketFD) 直接在 system
使用最初生成的随机元素来约束随机数组的连续元素是否有效。 例如:我想生成一组 10 个 addr、size 对来模拟典型的内存分配例程并具有如下类: class abc; rand bit[5:0
我正在创建一个必须使用system(const char*)函数来完成一些“繁重工作”的应用程序,并且我需要能够为用户提供粗略的进度百分比。例如,如果操作系统正在为您移动文件,它会为您提供一个进度条,
我即将编写一些项目经理、开发人员和业务分析师会使用的标准/指南和模板。目标是更好地理解正在开发或已经开发的解决方案。 其中一部分是提供有关记录解决方案的标准/指南。例如。记录解决/满足业务案例/用户需
在开发使用压缩磁盘索引或磁盘文件的应用程序时,其中部分索引或文件被重复访问(为了论证,让我们说一些类似于 Zipfian 分布的东西),我想知道什么时候足够/更好地依赖操作系统级缓存(例如,Debia
我们编写了一个 powershell 脚本,用于处理来自内部系统的图像并将其发送到另一个系统。现在,业务的另一部分希望加入其中,对数据进行自己的处理,并将其推送到另一个系统。打听了一下,公司周围有几个
我正在尝试朗姆酒我的应用程序,但我收到以下错误:System.Web.HttpUnhandledException:引发了“System.Web.HttpUnhandledException”类型的异
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
所以我在其他程序中没有收到此错误,但我在这个程序中收到了它。 这个程序是一个我没有收到错误的示例。 #include int main() { system("pause"); } // en
我在 c# System.URI.FormatExption 中遇到问题 为了清楚起见,我使用的是 Segseuil 的 Matlab 方法,并且它返回一个图片路径 result。我想为其他用户保存此
我正在尝试像这样设置文本框的背景色: txtCompanyName.BackColor = Drawing.Color.WhiteSmoke; 它不喜欢它,因为它要我在前面添加系统,例如: txtCo
请帮助我解决 System.StackOverflowException我想用 .aspx 将记录写入数据库我使用 4 层架构来实现这一切都正常但是当我编译页面然后它显示要插入数据的字段时,当我将数据
我使用了一些通常由系统调用的API。 因此,我将 android:sharedUserId="android.uid.system" 添加到 manifest.xml, 并使用来自 GIT 的 And
我正在尝试创建一个小型应用程序,它需要对/system 文件夹进行读/写访问(它正在尝试删除一个文件,并创建一个新文件来代替它)。我可以使用 adb 毫无问题地重新挂载该文件夹,如果我这样做,我的应用
我想从没有 su 的系统 priv-app 将/system 重新挂载为 RW。如何以编程方式执行此操作?只会用 Runtime.getruntime().exec() 执行一个 shell 命令吗
我正在尝试制作一个带有登录系统的程序我对此很陌生,但我已经连续工作 8 个小时试图解决这个问题。这是我得到的错误代码 + ServerVersion 'con.ServerVersion' threw
当我“构建并运行”Code::Blocks 中的程序时,它运行得非常好!但是当我从“/bin”文件夹手动运行它时,当它试图用 system() 调用“temp.bat”时,它会重置。这是为什么?它没有
我想使用 system/pipe 命令来执行具有特殊字符的命令。下面是示例代码。通过系统/管道执行命令后,它通过改变特殊字符来改变命令。我很惊讶地看到系统命令正在更改作为命令传递的文本。 run(ch
我是一名优秀的程序员,十分优秀!