- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用计算内核渲染顶点/片段着色器。
每一帧我都以通常的方式绑定(bind)大型资源(例如 450MB 纹理):
computeEncoder.setTexture(highResTexture, index: 0)
computeEncoder.setBuffer(largeBuffer, offset: 0, index: 0)
...
renderEncoder.setVertexTexture(highResTexture, index: 0)
renderEncoder.setVertexBuffer(largeBuffer, offset: 0, index: 0)
单个纹理的带宽接近 1GB,而且我有更多 Assets ,总计几百兆,所以我为每一帧绑定(bind)了大约 1.5GB。
有没有办法将纹理/缓冲区绑定(bind)到 GPU 一次,这样它们就可以在内核和顶点函数中使用,而无需绑定(bind)每一帧?
我可能是错的,但我认为在最近的几个 WWDC 之一中引入了一些东西,所以我想我会要求确保我没有遗漏任何东西。
编辑:
通过在顶点函数中简单地绑定(bind)一个纹理,我已经在计算编码器中绑定(bind)了它,它确实显示了更多的纹理带宽使用,即使我没有将它用于捕获。
GPU 读取带宽:
此外,如果它像您描述的那样工作,为什么使用多个命令编码器会警告浪费带宽?如果我使用多个发射器,每个发射器都有一个单独的编码器,即使它们绑定(bind)相同的资源,我也会收到性能警告:
最佳答案
我觉得你很困惑。将纹理设置为命令编码器不会消耗带宽。在着色器中读取它或对其进行采样。
当您为编码器设置纹理或任何其他缓冲区时,发生的情况是驱动程序使用某种机制将少量元数据传递给着色器,可能是您作为 API 用户看不到的一些内部缓冲区。它不会在任何地方“加载”纹理。在着色器中标记为 constant
地址缓冲区的缓冲区是一个异常(exception),因为这些缓冲区可能被 GPU 预取以获得更好的性能。
发生的另一件事是资源成为驻留,这意味着 GPU 驱动程序将映射 GPU 地址虚拟内存表中的地址范围以指向存储纹理内容的物理内存.这也不会消耗内存,但会消耗可用的虚拟地址空间。在某些情况下,您可能会用完虚拟地址空间,但这不是带宽问题。
不过,如果您确实有很多 纹理,您实际上可能会花费大量 CPU 时间来编码那些 setTexture
命令。相反,您可以使用参数缓冲区。如果您的目标硬件支持第 2 层参数缓冲区,您可以将每个纹理放在参数缓冲区中。这将需要对所有这些纹理调用 useResource
,因为驱动程序需要知道您将使用这些纹理来使它们驻留,因此您仍将花费 CPU 时间对这些命令进行编码。为避免这种情况,您可以从一个或多个堆中分配所有纹理并在这些堆上调用 useHeaps
。这将使整个堆驻留,并且您不需要对单个资源调用 useResource
。关于这个话题有很多 WWDC 演讲,最新的是 Explore bindless rendering in Metal .
但再次重申:我在这里提到的任何内容都不会“浪费”带宽。
更新:
使用参数缓冲区的一个非常基本的例子是像这样使用它。
let argumentDescriptor = MTLArgumentDescriptor()
argumentDescriptor.index = 0
argumentDescriptor.dataType = .texture
argumentDescriptor.textureType = .type2D
let argumentEncoder = MTLArgumentEncoder(arguments: [argumentDescriptor])
let argumentBuffer = device.makeBuffer(length: argumentEncoder.encodedLength, options: [.storageModeShared])
argumentEncoder.setArgumentBuffer(argumentBuffer, offset: 0)
argumentEncoder.setTexture(someTexture, index: 0)
commandEncoder.setBuffer(argumentBuffer, offset: 0, index: 0)
commandEncoder.useResource(someTexture, usage: .read)
然后在着色器中,您将编写如下结构:
struct MyTexture
{
texture2d<float> texture [[ id(0) ]];
};
然后像这样绑定(bind)
device MyTexture& myTexture [[ buffer(0) ]]
并像使用任何其他结构一样使用它。这是一个非常基本的示例,您实际上可以使用反射从函数和绑定(bind)索引中为您创建那些 MTLArgumentEncoders
。
关于ios - 有没有一种方法可以一次绑定(bind) Assets 而不是每个命令编码器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71563690/
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
我有一系列 SQL 命令,我想在大约 40 个不同的表上运行。必须有一种方法可以在不编写 40 条不同命令的情况下执行此操作... 我在 SQL Server 中运行它。所有表都有不同的名称,我要操作
我习惯在 PHP 中使用命令“mysql_insert_id()”来返回插入到我的数据库中的最后一行的 id。 在 C# 中的 SQLite 中是否有等效的命令? 谢谢! -阿德娜 最佳答案 选择 l
试图找出一种方法来回填 ds 分区 Hive 表的分区。 我知道如何从 CLI 运行 Hive 命令,例如 $HIVE_HOME/bin/hive -e 'select a.col from tab1
我有 .bat 文件。看起来像下一个 ....many commands1 ftp -i -s:copy.txt ...many commands2 copy.txt 包含下一个命令 open ...
基本上我想输入 show 并检查是否有 show 命令或别名已定义并触发它,如果未定义则触发 git show 。 例如 rm 应该执行 rm 但 checkout 应该执行 git checkout
我公司的主数据库是 iSeries 机器,我已经非常习惯使用 DB2 命令和结构。我现在正在尝试做一个小项目,更新一个包含超过 300 万条记录的表。我想出一种比较和“清理”数据的更快方法是使用 My
我想在带有 Node 的终端中制作一个简单的按钮板,并“blessed”用于连接或运行不同的命令。 ----------------------------------------------- _
我们有一个 selenium IDE 脚本,正在转换为 python webdriver。以下命令未转换: [openWindow | http://mywebsite.com/index.php |
我正在学习这个关于从 GIT HUB 下载和安装 Web 文件的在线教程。我进入主题:启动我们的静态网站,系统提示我输入命令以下载和安装 Web 文件。但是,当我输入命令 yarn install 时
我在 shell 脚本中使用 elif 命令时遇到问题,就像在 fortran 中一样。 我有 100 家公司的员工名单。我想屏蔽那些员工少于 500 人的公司。我的脚本是 rm -f categor
我有一些 Linux 命令可以生成 token 。我在 Linux 机器上使用操作系统库形式的 Python 自动化了这些命令。它工作正常。 但是,当我在 Windows 中尝试相同的代码时,它没有返
本文分享自华为云社区《Git你有可能不知道交互式暂存》,作者:龙哥手记。 本节中的几个交互式 Git 命令可以帮助你将文件的特定部分组合成提交。 当你在修改了大量文件后,希望这些改动能拆分为若干提交而
我想知道如何使用 IN 比较语法来做到这一点。 当前的 SQL 查询是: select * from employee where (employeeName = 'AJAY' and month(e
我在这个位置安装了 Hadoop /usr/local/hadoop$ 现在我想列出 dfs 中的文件。我使用的命令是: hduser@ubuntu:/usr/local/hadoop$ bin/ha
是否有一个单一的 docker 命令可用于清除所有内容?如果正在运行,请停止所有容器、删除所有图像、删除所有卷...等。 最佳答案 我认为没有一个命令可以做到这一点。您首先需要停止所有容器使用 $ d
我基本上是在 clojure/nrepl 模式中寻找与 C-u C-x C-e 或 C-c C-p 等效的 Scheme。 我想要一个 C-x C-e 将输出打印到缓冲区,而不是仅仅在 repl 中。
我可以在 vim 中使用 pudb(一个 ncurses Python 调试器),因为,例如,:!python %在实际的终端窗口中运行。我更喜欢使用 gvim,但 gvim 运行 :!python
我正在尝试编写一个 FFMPEG 命令: 取为 输入 一个视频 input.mp4 和一个图像 pic.jpg 作为 输出 将 input.mp4 拆分为 20 秒的视频,按顺序重命名;对于每个分割视
我想转储视频每帧的比特率。我正在尝试使用 -vstats 获取此信息命令。当我运行此命令时 - ffmpeg -i input.mp4 -vstats 它显示至少应该定义一个文件。 如果有人能建议我任
我是一名优秀的程序员,十分优秀!