- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在尝试使用 ubuntu 上的 CUDA nsight 分析器为我的 GPU 加速应用程序的内存带宽利用率和计算吞吐量利用率建立两个总体测量值。该应用程序在 Tesla K20c GPU 上运行。
我想要的两个测量值在某种程度上与此图中给出的测量值相当:
问题是这里没有给出确切的数字,更重要的是我不知道这些百分比是如何计算的。
内存带宽利用率
Profiler 告诉我我的 GPU 的最大全局内存带宽为 208 GB/s。
这是指设备内存 BW 还是全局内存 BW?它说的是全局,但第一个对我来说更有意义。
对于我的内核,分析器告诉我设备内存带宽为 98.069 GB/s。
假设最大 208 GB/s 是指设备内存,那么我可以简单地将内存带宽利用率计算为 90.069/208 = 43% 吗?请注意,此内核会在没有额外的 CPU-GPU 数据传输的情况下执行多次。因此,系统 BW 并不重要。
计算吞吐量利用率
我不确定将计算吞吐量利用率转化为数字的最佳方法是什么。我最好的猜测是使用每周期指令与最大每周期指令的比率。探查器告诉我最大 IPC 是 7(见上图)。
首先,这到底是什么意思?每个多处理器有 192 个内核,因此最多有 6 个事件 warp。那不是说最大 IPC 应该是 6 吗?
探查器告诉我,我的内核发出了 IPC = 1.144 并执行了 IPC = 0.907。我应该将计算利用率计算为 1.144/7 = 16% 或 0.907/7 = 13% 还是两者都不是?
这两个测量值(内存和计算利用率)是否给出了关于我的内核使用资源的效率的充分第一印象?还是应该包括其他重要指标?
附加图表
最佳答案
注意:我将尝试更新此答案以获取更多详细信息。我不认为在 Visual Profiler 报告中可以轻松看到计算的所有单独组件。
计算利用率
这是逻辑管道的管道利用率:内存、控制流和算术。 SM 有许多未记录的执行管道。如果您查看指令吞吐量图表,您可以在较高水平上确定如何计算利用率。您可以阅读 kepler 或 maxwell 架构文档以获取有关管道的更多信息。 CUDA 核心是整数/单精度 float 学管道的营销术语。
此计算并非基于 IPC。它基于管道利用率和发布周期。例如,如果您发出 1 条指令/周期(从不双重发出),您可以达到 100% 的利用率。如果您以最大速率发出 double 指令(取决于 GPU),您也可以达到 100%。
内存带宽利用率
探查器计算 L1、TEX、L2 和设备内存的利用率。显示最高值。数据路径利用率非常高但带宽利用率非常低的情况很可能发生。
还应计算内存延迟限制原因。很容易让程序受内存延迟限制但不受计算利用率或内存带宽限制。
关于c++ - CUDA 探查器 : Calculate memory and compute utilization,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28138494/
我之前让 dll 注入(inject)器变得简单,但我有 Windows 7,我用 C# 和 C++ 做了它,它工作得很好!但是现在当我在 Windows 8 中尝试相同的代码时,它似乎没有以正确的方
我正在尝试制作一个名为 core-splitter 的元素,该元素在 1.0 中已弃用,因为它在我们的项目中起着关键作用。 如果您不知道 core-splitter 的作用,我可以提供一个简短的描述。
我有几个不同的蜘蛛,想一次运行所有它们。基于 this和 this ,我可以在同一个进程中运行多个蜘蛛。但是,我不知道如何设计一个信号系统来在所有蜘蛛都完成后停止 react 器。 我试过了: cra
有没有办法在达到特定条件时停止扭曲 react 器。例如,如果一个变量被设置为某个值,那么 react 器应该停止吗? 最佳答案 理想情况下,您不会将变量设置为一个值并停止 react 器,而是调用
https://code.angularjs.org/1.0.0rc9/angular-1.0.0rc9.js 上面的链接定义了外部js文件,我不知道Angular-1.0.0rc9.js的注入(in
我正在尝试运行一个函数并将服务注入(inject)其中。我认为这可以使用 $injector 轻松完成.所以我尝试了以下(简化示例): angular.injector().invoke( [ "$q
在 google Guice 中,我可以使用函数 createInjector 创建基于多个模块的注入(inject)器。 因为我使用 GWT.create 在 GoogleGin 中实例化注入(in
我在 ASP.NET Core 1.1 解决方案中使用配置绑定(bind)。基本上,我在“ConfigureServices Startup”部分中有一些用于绑定(bind)的简单代码,如下所示: s
我在 Spring MVC 中设置 initBinder 时遇到一些问题。我有一个 ModelAttribute,它有一个有时会显示的字段。 public class Model { privat
我正在尝试通过jquery post发布knockoutjs View 模型 var $form = $('#barcodeTemplate form'); var data = ko.toJS(vm
如何为包含多态对象集合的复杂模型编写自定义模型绑定(bind)程序? 我有下一个模型结构: public class CustomAttributeValueViewModel { publi
您好,我正在尝试实现我在 this article 中找到的扩展方法对于简单的注入(inject)器,因为它不支持开箱即用的特定构造函数的注册。 根据这篇文章,我需要用一个假的委托(delegate)
你好,我想自动注册我的依赖项。 我现在拥有的是: public interface IRepository where T : class public interface IFolderReposi
我正在使用 Jasmine 测试一些 Angular.js 代码。为此,我需要一个 Angular 注入(inject)器: var injector = angular.injector(['ng'
我正在使用 Matlab 代码生成器。不可能包含代码风格指南。这就是为什么我正在寻找一个工具来“ reshape ”、重命名和重新格式化生成的代码,根据我的: 功能横幅约定 文件横幅约定 命名约定 等
这个问题在这里已经有了答案: Where and why do I have to put the "template" and "typename" keywords? (8 个答案) 关闭 8
我开发了一种工具,可以更改某些程序的外观。为此,我需要在某些进程中注入(inject)一个 dll。 现在我基本上使用这个 approach .问题通常是人们无法注入(inject) dll,因为他们
我想使用 swing、spring 和 hibernate 编写一个 java 应用程序。 我想使用数据绑定(bind)器用 bean 的值填充 gui,并且我还希望它反射(reflect) gui
我有这段代码,当两个蜘蛛完成后,程序仍在运行。 #!C:\Python27\python.exe from twisted.internet import reactor from scrapy.cr
要点是 Spring Batch (v2) 测试框架具有带有 @Autowired 注释的 JobLauncherTestUtils.setJob。我们的测试套件有多个 Job 类提供者。因为这个类不
我是一名优秀的程序员,十分优秀!