gpt4 book ai didi

c++ - 使用 Nsight 确定银行冲突和合并

转载 作者:太空宇宙 更新时间:2023-11-04 03:04:54 26 4
gpt4 key购买 nike

我如何使用并行 nsight 知道非合并读/写和存储区冲突的数量?
此外,当我使用 nsight 是一个分析器时我应该看什么?哪些重要字段可能会导致我的程序变慢?

最佳答案

我不使用 NSight,但您将使用探查器查看的典型字段基本上是:

  • 内存消耗
  • 花在功能上的时间

更具体地说,使用 CUDA,您将注意 GPU 的占用情况。
其他有趣的值是编译器设置局部变量的方式:在寄存器中或在本地内存中。

最后,您将检查将数据传入和传出 GPU 所花费的时间,并将其与计算时间进行比较。

关于c++ - 使用 Nsight 确定银行冲突和合并,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6574814/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com