- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在尝试使用 ubuntu 上的 CUDA nsight 分析器为我的 GPU 加速应用程序的内存带宽利用率和计算吞吐量利用率建立两个总体测量值。该应用程序在 Tesla K20c GPU 上运行。
我想要的两个测量值在某种程度上与此图中给出的测量值相当:
问题是这里没有给出确切的数字,更重要的是我不知道这些百分比是如何计算的。
内存带宽利用率
Profiler 告诉我我的 GPU 的最大全局内存带宽为 208 GB/s。
这是指设备内存 BW 还是全局内存 BW?它说的是全局,但第一个对我来说更有意义。
对于我的内核,分析器告诉我设备内存带宽为 98.069 GB/s。
假设最大 208 GB/s 是指设备内存,那么我可以简单地将内存带宽利用率计算为 90.069/208 = 43% 吗?请注意,此内核会在没有额外的 CPU-GPU 数据传输的情况下执行多次。因此,系统 BW 并不重要。
计算吞吐量利用率
我不确定将计算吞吐量利用率转化为数字的最佳方法是什么。我最好的猜测是使用每周期指令与最大每周期指令的比率。探查器告诉我最大 IPC 是 7(见上图)。
首先,这到底是什么意思?每个多处理器有 192 个内核,因此最多有 6 个事件 warp。那不是说最大 IPC 应该是 6 吗?
探查器告诉我,我的内核发出了 IPC = 1.144 并执行了 IPC = 0.907。我应该将计算利用率计算为 1.144/7 = 16% 或 0.907/7 = 13% 还是两者都不是?
这两个测量值(内存和计算利用率)是否给出了关于我的内核使用资源的效率的充分第一印象?还是应该包括其他重要指标?
附加图表
最佳答案
注意:我将尝试更新此答案以获取更多详细信息。我不认为在 Visual Profiler 报告中可以轻松看到计算的所有单独组件。
计算利用率
这是逻辑管道的管道利用率:内存、控制流和算术。 SM 有许多未记录的执行管道。如果您查看指令吞吐量图表,您可以在较高水平上确定如何计算利用率。您可以阅读 kepler 或 maxwell 架构文档以获取有关管道的更多信息。 CUDA 核心是整数/单精度 float 学管道的营销术语。
此计算并非基于 IPC。它基于管道利用率和发布周期。例如,如果您发出 1 条指令/周期(从不双重发出),您可以达到 100% 的利用率。如果您以最大速率发出 double 指令(取决于 GPU),您也可以达到 100%。
内存带宽利用率
探查器计算 L1、TEX、L2 和设备内存的利用率。显示最高值。数据路径利用率非常高但带宽利用率非常低的情况很可能发生。
还应计算内存延迟限制原因。很容易让程序受内存延迟限制但不受计算利用率或内存带宽限制。
关于c++ - CUDA 探查器 : Calculate memory and compute utilization,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28138494/
是否可以使用 boost::compute 复制自定义结构数组?例如 struct A { float a; }; struct AB { float a; float b; }; BOOST_COM
有谁知道如何在项目上配置的Google Cloud Networks之间移动现有的VM实例?我知道您可以在创建新VM时指定网络,但是似乎没有一种实例化它即可对其进行更改的功能。 任何指针表示赞赏! 保
我正在尝试遵循Google云平台控制台上的教程,以使用Compute Engine创建MongoDB应用程序。我遵循创建虚拟机的教程,但未创建它们,并返回以下错误: 字段“resource.netwo
我想知道是否可以将一个实例的类型更改为另一个实例,例如: n1-standard-1至n1-standard-2 我在文档中没有看到任何内容,但可能是我错过了一些东西。 如果这是不可能的,我该如何处理
我正在尝试让我的GCE实例监听多个IP地址(出于SEO的原因-在同一实例上托管多个低流量站点)。 最终目标:mydomain.com指向IP1,myotherdomain.es指向IP2,GCE实例将
使用scp,我可以添加-r标志以通过ssh将目录下载到本地计算机。 使用时: gcloud compute scp -r 它说“ -r”不是可用选项。 没有-r,我会收到一条错误消息,说我的源路径是一
仅某些IP地址的http负载均衡器存在严重问题。 我在这里还看到了其他一些帖子。我们确保防火墙正常,甚至删除并重新创建了转发规则。自IP更改以来,这非常令人讨厌。 仍然没有喜悦。问题仅影响某些IP地址
我正在尝试删除/删除不再使用的静态IP地址,并且看不到执行此操作的方法。我可以从文档中得到的最接近的是this page,它说: When an instance is stopped, you ca
我每天从台式计算机运行一个简单的任务 3 次。它在下午 4 点、晚上 8 点和凌晨 1 点连接到某个网站,下载少量数据(小于 50mb),并将其存储在硬盘上。每天运行这一点很重要,所以我正在考虑将其转
我是一个关于在Google Compute Engine上联网的问题。 是否可以在您的帐户上设置默认的“源代码/ IP范围”,以便在创建新规则时自动设置此值? 例如,如果我创建此规则: gcloud
我正在尝试使用 POST gcloud CLI 创建一个“带有容器”的 GCE 实例(由 https://www.googleapis.com/compute/v1/projects/{project
我们像这样通过命令行创建实例: gcloud compute instances create instance-name [--stuff otherstuff] --metadata-from-f
在我的本地 macOS 上,以下命令运行良好: $ gcloud source repos clone myrepo --project=myproject (虽然我不确定它是否有效,因为之前我遵循了
在 AWS SDK , EC2实例可以通过 AmazonEC2Client 以编程方式启动.是否GCP一般或Compute Engine特别just offer the CLI-based gclou
我想使用 SparkleShare 在计算机之间同步文件,所以我正在寻找一种方法让 git 存储库在线保存文件。 我正在考虑使用 Google Compute Engine 来托管它们。如果我只为我实
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 4年前关闭。 Improve thi
几周前,我在随意玩弄 Google Cloud Console,并创建了一个 Compute Engine VM。这个过程就像“创建一个虚拟机,命名它,保存”一样简单,就是这样。我现在不需要 Comp
我正在关注 this instruction在 GCE 上设置多个实例或服务器集群。它运行良好,但我不知道如何更新应用程序代码。例如,我有一些错误修复,需要更新代码并重新加载所有实例。无论如何我可以做
我在两个 VM 实例上有一个 node.js 应用程序,我试图通过网络负载平衡来进行负载平衡。为了测试我的服务器是否已启动并提供服务,我在我的应用程序内部监听端口上收到了运行状况检查请求“/healt
如何在GCE中永久设置实例的主机名?我可以通过主机名进行设置,但是重启后它又消失了。 我试图输入元数据(主机名:f.q.d.n),但这没有完成。但是它应该通过元数据(https://github.co
我是一名优秀的程序员,十分优秀!