gpt4 book ai didi

cuda - Nsight 分析器显示的 "Other"问题停止原因是什么?

转载 作者:行者123 更新时间:2023-12-02 17:39:12 30 4
gpt4 key购买 nike

我的内核在 CC 3.0 (Kepler) 上的性能比在 CC 2.0 (Fermi) 上的性能差。在 Nsight 分析器中,Warp Issue Efficiency 图表显示 60% 的时间没有合格的 warp,而Issue Stall Reasons 图表显示 60% 的时间没有合格的 warp。这些都是由于“其他”。

我想知道其他问题停滞的原因是什么以及我可以采取哪些措施来减少它们。

CUDA 5.0。/夜视3.0。 RC/CC 3.0。

Issue Stall Reasons

最佳答案

在 Nsight Visual Studio Edition 3.0 CUDA Profiler 中,问题效率显示扭曲停顿原因的饼图。停顿原因包括指令获取、执行依赖性、数据请求、纹理、同步和其他。

对于计算能力 3.* 设备,“其他”类别是由于以下原因导致事件扭曲停止的时间百分比:

  • 执行单元繁忙(减少低吞吐量整数运算的使用)
  • 寄存器库冲突(编译器问题有时会因大量使用矢量数据类型而变得更严重)
  • 每个调度程序的扭曲太少

对于计算能力 5.* 和 6.* 设备,“其他”类别是由于以下原因导致事件扭曲停止的时间百分比:

  • 寄存器库冲突(编译器问题有时会因大量使用矢量数据类型而变得更严重)
  • 扭曲等待解析分支
  • 优先级较低且当前不考虑进行调度的 warp

对于 5.* 和 6.*,尤其是 gp100,如果内核达到每个 warp 调度程序 32 个 warp,则最后一个原因可能非常高(~75%)。

这些停顿原因被归为另一类,因为很难确定开发人员可以采取哪些措施来解决这些问题。

关于cuda - Nsight 分析器显示的 "Other"问题停止原因是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14887807/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com