- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
根据此链接 https://docs.nvidia.com/nsight-compute/ProfilingGuide/index.html :
Warp was stalled waiting for the MIO (memory input/output) instructionqueue to be not full. This stall reason is high in cases of extremeutilization of the MIO pipelines, which include special mathinstructions, dynamic branches, as well as shared memory instructions.
May be triggered by local, global, shared, attribute, IPA, indexedconstant loads (LDC), and decoupled math.
最佳答案
MIO 是 NVIDIA SM 中的一个分区(从 Maxwell 开始),其中包含在 4 个 warp 调度程序或更慢的数学执行单元(例如 XU 管道)之间共享的执行单元。
向这些执行单元发出的指令首先被发送到指令队列中,从而允许warp 调度程序继续从warp 发出独立的指令。如果warp 的下一条指令指向已满的指令队列,则warp 将停止,直到队列未满并且指令可以入队。当发生这种停顿时,warp 将根据指令队列类型报告节流原因。指令队列到管道的映射因芯片而异。这是一般的映射。
关于cuda - MIO throttle 失速什么时候发生?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66233462/
我是一名优秀的程序员,十分优秀!