- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
“nvprof”结果中的“GPU 事件”和“API 调用”有什么区别?
不知道为什么同一个函数会有时差。
例如,[CUDA memcpy DtoH] 和 cuMemcpyDtoH。
所以我不知道什么时候合适。
我必须写一个测量,但我不知道使用哪个。
最佳答案
事件是 GPU 对某些特定任务的实际使用。
事件可能正在运行内核,或者可能正在使用 GPU 硬件将数据从主机传输到设备,反之亦然。
这种“事件”的持续时间是通常意义上的持续时间:这个事件什么时候开始使用 GPU,什么时候停止使用 GPU。
API 调用是由您的代码(或由您的代码进行的其他 CUDA API 调用)对 CUDA 驱动程序或运行时库的调用。
这两者当然是相关的。您可以通过某种 API 调用来启动 GPU 上的事件。这适用于数据复制和运行内核。
但是,“持续时间”或报告时间可能有所不同。例如,如果我启动一个内核,可能有很多原因(例如,在同一流中尚未完成的先前事件)导致内核没有“立即”开始执行。从 API 的角度来看,内核“启动”可能比内核的实际运行时间持续更长的时间。
这也适用于 API 使用的其他方面。例如,cudaDeviceSynchronize()
可能需要很长时间或很短的时间,具体取决于设备上正在发生的事情(事件)。
通过研究 NVIDIA 视觉分析器 (nvvp) 中的时间线,您可能会更好地了解这两种报告类别之间的区别。
让我们以您的具体案例为例。这似乎是一个与驱动程序 API 相关联的应用程序,并且您显然有一个内核启动和(我猜)内核启动后立即执行 D->H memcpy 操作:
multifrag_query_hoisted_kernels (kernel launch - about 479ms)
cuMemcpyDtoH (data copy D->H, about 20us)
cuMemcpyDtoH
call,这是一个阻塞调用。这意味着调用会导致 CPU 线程在那里等待,直到前一个 CUDA 事件完成。
cuMemcpyDtoH
的调用所需的时间也比479ms短得多。并继续下一行代码比 20us 长得多,因为它必须在那个库调用那里等待,直到之前发布的内核完成。这两者都是由于 CUDA 内核启动的异步特性,以及
cuMemcpyDtoH
的“阻塞”或同步特性。 .
关于c++ - 'GPU activities' 和 'API calls' 在 'nvprof' 的结果中有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55574096/
我在stackoverflow上查过很多类似的问题,比如call.call 1 , call.call 2 ,但我是新人,无法发表任何评论。我希望我能找到关于 JavaScript 解释器如何执行这些
“strace 是一个系统调用跟踪器,即一个调试工具,它打印出另一个进程/程序进行的所有系统调用的跟踪。”如果系统调用递归工作或一个系统调用调用另一个系统调用怎么办。我怎样才能得到这些信息? 可能的解
我的问题很简单:我正在将一个函数传递给其他一些稍后调用的函数(示例回调函数),问题是何时、为何以及最佳做法是什么。 样本:我有 xxx() 函数,我必须传递它,如下面的 window.onload 事
我是 Java 新手,我正在尝试学习 ScheduledExecutorService 接口(interface)。我在网上看到了下面的代码。 我没有看到任何对 Callable.call() 方法的
这是我的调用过程: System.out.println
在 typescript 中,我有一个 DataAccess 类,以便所有 Ajax 调用都通过单个对象进行路由,以节省应用程序中许多地方的代码重复。 在使用这种方法时,我需要使用回调将响应返回到调用
如何使用模拟来计算通过 call 或 apply 进行的函数调用 // mylib.js module.exports = { requestInfo: function(model, id) {
每次我尝试roxygenize 一个包我都会得到这个错误: Error: is.call(call) is not TRUE traceback() 的结果: 11: stop(sprintf(nge
这里如果我有一个记录“调用我的函数”的函数 function myFunction() { console.log('called my function') } Function.prototy
在 Javascript 中,Function.call() 可以在给定 this 值和零个或多个参数的情况下调用 Function。 Function.call 本身就是一个函数。所以理论上,Fun
这个问题已经有答案了: "object is not a function" when saving function.call to a variable (3 个回答) a is a functi
在调用 UITableView 上的 reloadData 方法后,我曾多次遇到此问题,但我不明白为什么? 这是一个问题,因为如果更新 TableView 的数据,tableview将不必要地查询不存
我继承了大约 400 行写得非常奇怪的 Fortran 77 代码,我正在尝试逐步分析它以使其在我的脑海中清晰。 无论如何,我有一个类似 header 的文件(实际上是一个 .h,但其中的代码是 fo
这是我的代码 class AuthAction(callbackUri:String) extends ActionBuilder[UserRequest] with ActionRefiner[
我继承了大约 400 行写得非常奇怪的 Fortran 77 代码,我正在尝试逐步分析它以使其在我的脑海中清晰。 无论如何,我有一个类似 header 的文件(实际上是一个 .h,但其中的代码是 fo
我知道这个问题之前在这里被问过 iOS 6 shouldAutorotate: is NOT being called .但我的情况有点不同。 最初,在应用程序启动时,我加载了一个 viewContr
我是 headfirst 设计模式的读者,我注意到了这一点。 “好莱坞原则,别叫我们,我们叫你” 这意味着高级组件告诉低级组件“不要调用我们,我们调用你” High-Level Component 是
这个问题在这里已经有了答案: Why does passing variables to subprocess.Popen not work despite passing a list of ar
我刚找到一个覆盖 OnPaintBackground 的表单。奇怪的是它从来没有被调用过!就像,完全一样。为什么是这样?表单被刷新、移动、调整大小等等,所以它应该一些重新绘制,对吧? 最佳答案 是否设
调用函数的方式 考虑这个简单的函数: function my(p) { console.log(p) } 我可以这样调用它: my("Hello"); 也像这样: my.call(this, "Hel
我是一名优秀的程序员,十分优秀!