gpt4 book ai didi

CUDA : How to detect shared memory bank conflict on device with compute capabiliy >= 7. 2?

转载 作者:行者123 更新时间:2023-12-05 05:11:42 26 4
gpt4 key购买 nike

在计算能力 <= 7.2 的设备上,我总是使用

nvprof --events shared_st_bank_conflict

但是当我使用 CUDA10 在 RTX2080ti 上运行它时,它返回

警告:跳过设备 0 上的分析,因为计算能力大于 7.2 的设备不支持分析

那么如何检测此设备上是否存在共享内存库冲突?

我已经安装了 Nvidia Nsight Systems 和 Nsight Compute,没有找到这样的分析报告...

感谢

最佳答案

这似乎是一个问题,并在 this 中得到解决。发布到 NVIDIA 论坛。显然,使用其中一种 Nsight 工具(CLI 或 UI)应该支持它。

关于CUDA : How to detect shared memory bank conflict on device with compute capabiliy >= 7. 2?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55297281/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com