gpt4 book ai didi

cuda - 带宽的 nvprof 选项

转载 作者:行者123 更新时间:2023-12-03 18:15:44 36 4
gpt4 key购买 nike

从命令行使用 nvprof --metrics 测量带宽的正确选项是什么?我正在使用 flop_dp_efficiency 来获得峰值 FLOPS 的百分比,但是手册中似乎有很多带宽测量选项,我不太明白我在测量什么。例如dram_read、dram_write、gld_read、gld_write 在我看来都一样。另外,我是否应该通过假设两者同时发生来将带宽报告为读+写吞吐量的总和?

编辑:

根据图表的出色答案,从设备内存到内核的带宽是多少?我想在从内核到设备内存的路径上采用最小的带宽(读+写),这可能是 dram 到 L2 缓存。

我试图通过测量 FLOPS 和带宽来确定内核是受计算限制还是受内存限制。

最佳答案

为了了解这方面的分析器指标,有必要了解 GPU 中的内存模型。我找到 the diagram published in the Nsight Visual Studio edition documentation有用。我用编号箭头标记了图表,这些箭头指的是我在下面列出的编号指标(和传输方向):

enter image description here

请引用CUDA profiler metrics reference每个指标的描述:

  • dram_read_throughput、dram_read_transactions
  • dram_write_throughput、dram_write_transactions
  • sysmem_read_throughput、sysmem_read_transactions
  • sysmem_write_throughput、sysmem_write_transactions
  • l2_l1_read_transactions, l2_l1_read_throughput
  • l2_l1_write_transactions, l2_l1_write_throughput
  • l2_tex_read_transactions, l2_texture_read_throughput
  • 纹理是只读的,此路径上没有可能的事务
  • shared_load_throughput, shared_load_transactions
  • shared_store_throughput, shared_store_transactions
  • l1_cache_local_hit_rate
  • l1 是直写缓存,因此此路径没有(独立的)度量标准 - 请参阅其他本地度量标准
  • l1_cache_global_hit_rate
  • 参见 12 上的注释
  • gld_效率、gld_吞吐量、gld_transactions
  • gst_efficiency、gst_throughput、gst_transactions

  • 笔记:
  • 从右到左的箭头表示读取事件。从左到右的箭头表示写入事件。
  • “全局”是一个逻辑空间。从程序员的角度来看,它指的是逻辑地址空间。指向“全局”空间的事务可能会在缓存之一、系统内存或设备内存 (dram) 中结束。另一方面,“dram”是一个物理实体(例如 L1 和 L2 缓存)。 “逻辑空间”都在图表的第一列中描述,紧邻“内核”列的右侧。右侧的其余列是物理实体或资源。
  • 我没有尝试用图表上的位置标记每个可能的内存指标。如果您需要弄清楚其他图表,希望这张图表会有所启发。

  • 有了上面的描述,您的问题可能仍然没有得到解答。然后,您有必要澄清您的要求——“您想准确测量什么?”但是,根据您所写的问题,您可能想要查看 dram_xxx 指标,如果您关心的是实际消耗的内存带宽。

    此外,如果您只是想估计最大可用内存带宽,请使用 CUDA 示例代码 bandwidthTest可能是获得代理测量的最简单方法。只需使用报告的设备到设备带宽数,作为对您的代码可用的最大内存带宽的估计。

    结合上述想法,dram_utilization 指标给出了一个缩放结果,表示实际使用的总可用内存带宽的部分(从 0 到 10)。

    关于cuda - 带宽的 nvprof 选项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37732735/

    36 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com