gpt4 book ai didi

performance - 如何查看 GPU 在复杂算法中的瓶颈?

转载 作者:行者123 更新时间:2023-12-04 03:12:07 26 4
gpt4 key购买 nike

我正在使用 GLSL 片段着色器进行 GPGPU 计算(我有我的理由)。

在 nSight 中,我看到我每帧执行 1600 次绘制调用。

可能有3个瓶颈:

  • 填充率
  • drawcall 太多了
  • 由于我的 GPU->CPU 下载和 CPU->GPU 上传导致 GPU 停顿

我如何找到它是哪一个?

如果我的算法很简单(例如高斯模糊之类的),我可以强制每个绘图调用的视口(viewport)为 1x1,并且根据速度变化,我可以排除填充率问题。

不过,就我而言,这需要更改整个算法。

最佳答案

由于您提到了 Nvidia NSight 工具,您可以尝试按照以下 Nvidia 博客文章中说明的过程进行操作。

它解释了如何阅读和理解硬件性能计数器以解释性能瓶颈。

用于优化任何 GPU 工作负载的峰值性能百分比分析方法:

https://devblogs.nvidia.com/the-peak-performance-analysis-method-for-optimizing-any-gpu-workload/

关于performance - 如何查看 GPU 在复杂算法中的瓶颈?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55868832/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com