c++ - 'GPU activities' 和 'API calls' 在 'nvprof' 的结果中有什么区别？-6ren

c++ - 'GPU activities' 和 'API calls' 在 'nvprof' 的结果中有什么区别？

转载作者：行者123 更新时间：2023-12-01 14:40:29

25

4

“nvprof”结果中的“GPU 事件”和“API 调用”有什么区别？

不知道为什么同一个函数会有时差。
例如，[CUDA memcpy DtoH] 和 cuMemcpyDtoH。

所以我不知道什么时候合适。
我必须写一个测量，但我不知道使用哪个。

最佳答案

事件是 GPU 对某些特定任务的实际使用。

事件可能正在运行内核，或者可能正在使用 GPU 硬件将数据从主机传输到设备，反之亦然。

这种“事件”的持续时间是通常意义上的持续时间:这个事件什么时候开始使用 GPU，什么时候停止使用 GPU。

API 调用是由您的代码(或由您的代码进行的其他 CUDA API 调用)对 CUDA 驱动程序或运行时库的调用。

这两者当然是相关的。您可以通过某种 API 调用来启动 GPU 上的事件。这适用于数据复制和运行内核。

但是，“持续时间”或报告时间可能有所不同。例如，如果我启动一个内核，可能有很多原因(例如，在同一流中尚未完成的先前事件)导致内核没有“立即”开始执行。从 API 的角度来看，内核“启动”可能比内核的实际运行时间持续更长的时间。

这也适用于 API 使用的其他方面。例如，cudaDeviceSynchronize()可能需要很长时间或很短的时间，具体取决于设备上正在发生的事情(事件)。

通过研究 NVIDIA 视觉分析器 (nvvp) 中的时间线，您可能会更好地了解这两种报告类别之间的区别。

让我们以您的具体案例为例。这似乎是一个与驱动程序 API 相关联的应用程序，并且您显然有一个内核启动和(我猜)内核启动后立即执行 D->H memcpy 操作:

multifrag_query_hoisted_kernels (kernel launch - about 479ms)
cuMemcpyDtoH  (data copy D->H, about 20us)

在这种情况下，由于 CUDA 内核启动是异步的，主机代码将启动内核，然后继续执行下一个代码行，即 cuMemcpyDtoH call，这是一个阻塞调用。这意味着调用会导致 CPU 线程在那里等待，直到前一个 CUDA 事件完成。

分析器的事件部分告诉我们内核持续时间约为 479 毫秒，复制持续时间约为 20 微秒(短得多)。从事件持续时间的角度来看，这些时间是相关的。但是，从主机CPU线程来看，主机CPU线程“启动”内核所需的时间远短于479ms，主机CPU线程完成对 cuMemcpyDtoH的调用所需的时间也比479ms短得多。并继续下一行代码比 20us 长得多，因为它必须在那个库调用那里等待，直到之前发布的内核完成。这两者都是由于 CUDA 内核启动的异步特性，以及 cuMemcpyDtoH 的“阻塞”或同步特性。 .

关于c++ - 'GPU activities' 和 'API calls' 在 'nvprof' 的结果中有什么区别？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55574096/

25

4

0

文章推荐： Java向文件写入/读取不可序列化对象

文章推荐： java - 分享我的 Swing 应用程序中的一个公共(public)变量

文章推荐： proxy - EJB 3.1 中的无接口(interface) View

javascript - Function.call、Function.prototype.call、Function.prototype.call.call 和 Function.prototype.call.call.call 之间的区别
我在stackoverflow上查过很多类似的问题，比如call.call 1 , call.call 2 ，但我是新人，无法发表任何评论。我希望我能找到关于 JavaScript 解释器如何执行这些
linux - 跟踪 : How to ascertain if a system call has called another system call?
“strace 是一个系统调用跟踪器，即一个调试工具，它打印出另一个进程/程序进行的所有系统调用的跟踪。”如果系统调用递归工作或一个系统调用调用另一个系统调用怎么办。我怎样才能得到这些信息？可能的解
Javascript 函数调用 : Regular call vs Call vs Bind Call
我的问题很简单:我正在将一个函数传递给其他一些稍后调用的函数(示例回调函数)，问题是何时、为何以及最佳做法是什么。样本:我有 xxx() 函数，我必须传递它，如下面的 window.onload 事
java - 没有看到任何对 Callable.call() 方法的调用，但 call() 方法内部的代码仍然被执行，call() 方法在哪里被调用？
我是 Java 新手，我正在尝试学习 ScheduledExecutorService 接口(interface)。我在网上看到了下面的代码。我没有看到任何对 Callable.call() 方法的
java - Activity : Passing variables from called process to calling process in call Activity
这是我的调用过程: System.out.println
javascript - typescript : Ajax call call always calling Error rather than success on success
在 typescript 中，我有一个 DataAccess 类，以便所有 Ajax 调用都通过单个对象进行路由，以节省应用程序中许多地方的代码重复。在使用这种方法时，我需要使用回调将响应返回到调用
javascript - 开 Jest : how to count call from mock methods called via `call` or `apply` ?
如何使用模拟来计算通过 call 或 apply 进行的函数调用 // mylib.js module.exports = { requestInfo: function(model, id) {
Roxygenize 失败... is.call(call) is not TRUE
每次我尝试roxygenize 一个包我都会得到这个错误: Error: is.call(call) is not TRUE traceback() 的结果: 11: stop(sprintf(nge
javascript - 为什么 call.call 调用函数
这里如果我有一个记录“调用我的函数”的函数 function myFunction() { console.log('called my function') } Function.prototy
javascript - 为什么我不能 .call() Function.call？
在 Javascript 中，Function.call() 可以在给定 this 值和零个或多个参数的情况下调用 Function。 Function.call 本身就是一个函数。所以理论上，Fun
javascript - String.call.call 类型？
这个问题已经有答案了: "object is not a function" when saving function.call to a variable (3 个回答) a is a functi
iphone - cellForRowAtIndexPath : being called immediately while numberOfRowsInSection: is not called
在调用 UITableView 上的 reloadData 方法后，我曾多次遇到此问题，但我不明白为什么？这是一个问题，因为如果更新 TableView 的数据，tableview将不必要地查询不存
Fortran 'call' 语句 : what can it actually call?
我继承了大约 400 行写得非常奇怪的 Fortran 77 代码，我正在尝试逐步分析它以使其在我的脑海中清晰。无论如何，我有一个类似 header 的文件(实际上是一个 .h，但其中的代码是 fo
scala - 具有替代方法的重载方法值 : when calling Call. 具有请求的绝对 URL
这是我的代码 class AuthAction(callbackUri:String) extends ActionBuilder[UserRequest] with ActionRefiner[
Fortran 'call' 语句 : what can it actually call?
我继承了大约 400 行写得非常奇怪的 Fortran 77 代码，我正在尝试逐步分析它以使其在我的脑海中清晰。无论如何，我有一个类似 header 的文件(实际上是一个 .h，但其中的代码是 fo
iOS 6 : supportedInterfaceOrientations is called but shouldAutorotate is not called
我知道这个问题之前在这里被问过 iOS 6 shouldAutorotate: is NOT being called .但我的情况有点不同。最初，在应用程序启动时，我加载了一个 viewContr
java - 这个例子有没有违反好莱坞原则 "dont call us, we call you"
我是 headfirst 设计模式的读者，我注意到了这一点。 “好莱坞原则，别叫我们，我们叫你” 这意味着高级组件告诉低级组件“不要调用我们，我们调用你” High-Level Component 是
Python subprocess.call - 添加一个变量到 subprocess.call
这个问题在这里已经有了答案: Why does passing variables to subprocess.Popen not work despite passing a list of ar
C#、WinForms : Why isn't OnPaintBackground called when I call Refresh()?
我刚找到一个覆盖 OnPaintBackground 的表单。奇怪的是它从来没有被调用过!就像，完全一样。为什么是这样？表单被刷新、移动、调整大小等等，所以它应该一些重新绘制，对吧？最佳答案是否设
javascript - Function.prototype.call.call 的简写？
调用函数的方式考虑这个简单的函数: function my(p) { console.log(p) } 我可以这样调用它: my("Hello"); 也像这样: my.call(this, "Hel

首页

博学

6Ren·AI

商城

c++ - 'GPU activities' 和 'API calls' 在 'nvprof' 的结果中有什么区别？