c++ - array_view.synchronize_asynch 会等待 parallel_for

c++ - array_view.synchronize_asynch 会等待 parallel_for_each 完成吗？

转载作者：行者123 更新时间：2023-11-30 04:12:30

30

4

如果我有一个 concurrency::array_view 在 concurrency::parallel_for_each 循环中运行，我的理解是我可以在 CPU 上继续其他任务，同时循环正在执行:

using namespace Concurrency;

array_view<int> av;
parallel_for_each(extent<1>(number),[=](index<1> idx)
{
  // do some intense computations on av
}

// do some stuff on the CPU while we wait

av.synchronize(); // wait for the parallel_for_each loop to finish and copy the data

但是，如果我不想等待并行 for 循环，而是尽快开始从 GPU 复制数据，怎么办？以下是否有效？

using namespace Concurrency;

array_view<int> av;
parallel_for_each(extent<1>(number),[=](index<1> idx)
{
  // do some intense computations on av
}

// I know that we won't be waiting to synch when I call this, but will we be waiting here
// until the data is available on the GPU end to START copying?
completion_future waitOnThis = av.synchronize_asynch();

// will this line execute before parallel_for_each has finished processing, or only once it
// has finished processing an the data from "av" has started copying back?

completion_future.wait();

我在 The Moth 上读到了这个话题, 但在阅读以下内容后，我并没有真正变得更聪明:

Please note that the parallel_for_each executes as if synchronous to the calling code, but in reality, it is asynchronous. I.e. once the parallel_for_each call is made and the kernel has been passed to the runtime, the some_code_B region continues to execute immediately by the CPU thread, while in parallel the kernel is executed by the GPU threads. However, if you try to access the (array or array_view) data that you captured in the lambda in the some_code_B region, your code will block until the results become available. Hence the correct statement: the parallel_for_each is as-if synchronous in terms of visible side-effects, but asynchronous in reality.

最佳答案

我不喜欢这种解释方式。更好的思考方式是 parallel_for_each 队列对 GPU 起作用，因此它几乎立即返回。在排队的工作完成之前，您的 CPU 端代码可以通过多种方式阻塞，例如，显式调用 synchronize，或从使用的 array_view 实例之一访问数据在 parallel_for_each

中

using namespace concurrency;

array_view<int> av;
parallel_for_each(extent<1>(number),[=](index<1> idx)
{
  // Queue (or schedule if you like) some intense computations on av
}

主机代码现在可以执行了。 AMP 计算可能已经开始也可能还没有开始。如果这里的代码访问av，那么它将阻塞直到GPU上的工作完成并且av中的数据已经写入并且可以与主机内存同步。

这是一个 future ，所以它也是一个计划任务。不能保证在任何特定点执行。如果它被调度，那么它将阻塞它正在运行的线程，直到 av 与主机内存正确同步(如上所述)。

completion_future waitOnThis = av.synchronize_asynch();

更多主机代码可以在这里执行。如果主机代码访问 av，那么它将阻塞直到 parallel_for_each 完成(如上所述)。在某个时候，运行时将执行 future 并阻塞，直到 av 与主机内存同步。如果它是可写的并且已被更改，那么它将被复制回主机内存。

completion_future.wait();

对 wait 的调用将阻塞，直到 future 完成(在调用 wait 之前，不能保证任何事情都已实际执行)。此时可以保证 GPU 计算已完成，av 可以在 CPU 上访问。

话虽如此，添加 waitOnThis future 似乎过于复杂了。

array_view<int> av;
parallel_for_each(extent<1>(number),[=](index<1> idx)
{
  // do some intense computations on av on the GPU
}

// do some independent CPU computation here.

av.synchronize();

// do some computation on the CPU that relies on av here.

MSDN 文档在这个主题上不是很好。以下blog post更好。在同一个博客上还有一些关于异步 API 的其他帖子。

关于c++ - array_view.synchronize_asynch 会等待 parallel_for_each 完成吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19830470/

30

4

0

文章推荐： c++ - std::map 和 std::unordered_set 中的类类型

文章推荐： Android编码更高效和有效

文章推荐： java - 是否有可能避免这种未经检查的 Actor 阵容？

文章推荐： java - 名称错误 NoClassDefFoundError

等待
我试图让脚本暂停大约 1 秒，然后继续执行脚本，但我似乎无法弄清楚如何做。这是我的代码: function hello() { alert("Hi!") //I need about a 1
java - 等待()/等待(超时)/ sleep (超时)？
wait() 和 wait(timeout) 之间有什么区别。无论如何 wait() 需要等待通知调用，但为什么我们有 wait(timeout)？那么 sleep(timeout) 和 wait(
javascript - 运行PHP，等待；运行 JavaScript，等待；然后提交表格？
我需要做什么: 我有一个带有文件输入和隐藏文本输入的上传表单。用户上传图像，图像被操作，然后发送到远程服务器进行处理，这需要几秒钟，然后远程服务器将最终的图像发送回家庭服务器，并保存在新文件夹中。 J
c++ - 为什么我的 Winsock 应用程序有时在 listen() 等待，有时在 accept() 等待？
大家好，我正在使用 Visual C++ 2010，尝试使用 Winsock 编写服务器/客户端应用程序...我不确定为什么，但有时服务器会在 listen() 函数处等待，有时会在 accept 处
javascript - IE 10 等待 XMLHttpRequest 等待 6 分钟然后响应请求(使用 AngularJS 的 CRSF 实现)
任务描述我为我的 Angular 应用程序实现了 CRSF 保护。服务器检查 crsf token 是否位于请求的 header “X-CSRF-TOKEN”中。如果不是，它会发送一个 HTTP 响
通用循环中的javascript异步/等待
我想做这个例子https://stackoverflow.com/a/33585993/1973680同步。这是正确的实现方式吗？ let times= async (n,f)=>{
Java延迟/等待
我如何将 while 循环延迟到 1 秒间隔，而不会将其运行的整个代码/计算机的速度减慢到一秒延迟(只是一个小循环)。最佳答案 Thread.sleep(1000); // do nothing f
java - 等待，通知来自同步上下文的方法
我知道这是一个重复的问题。但是我无法通过解释来理解。我想用一个很好的例子来清楚地理解它。任何人都可以帮忙吗。 “为什么我们从同步上下文中调用 wait()、notify() 方法”。最佳答案当我们
jquery - 虽然变量未定义 - 等待
我有一个 click 事件，该事件是第一次从另一个地方自动触发的。我的问题是它运行得太快，因为所需的变量仍在由 Flash 和 Web 服务定义。所以现在我有: (function ($) {
javascript - 取消异步/等待
我有如下功能 function async populateInventories(custID){ this.inventories = await this.inventoryServic
javascript - 等待 ".then"解决
我一直对“然后”不被等待的行为感到困扰，我明白其原因。然而，我仍然需要绕过它。这是我的用例。 doWork(family) { return doWork1(family)
dart - 如何在Dart中实现异步/等待
我想我理解异步背后的想法，返回一个Future，但是我不清楚异步在一个非常基本的层面上如何表现。据我了解，它不会自动在程序中创建异步行为。例如: import 'dart:async'; main()
dart - Dart中的异步/等待
我正在制作一个使用异步的Flutter应用程序，但它的工作方式不像我对它的了解。所以我对异步和在 Dart 中等待有一些疑问。这是一个例子: Future someFunction() async {
azure - 等待\依赖于模块中父级中的资源
我在 main.tf 中创建资源组和 vNet，并在同一文件中引用模块。问题是，模块无法从模块访问这些资源。相关代码(删除了大部分代码，只留下相关部分): main.tf: module "worke
javascript - 等待 promise ？
我的代码的问题是，当代码第一次运行时，我试图获取的 dom 元素并不总是存在，如果它不存在，那么永远不会做出 promise 。我是否可以等到 promise 做出后再尝试实现它？我希望我的最后一
javascript - 如何在我的代码中实现回调/等待？
所以，过去几天我一直在研究这段代码，并尝试实现回调/等待/任何需要的东西，但没有成功。问题是，我如何等待响应，直到我得到两个函数的回调？ (以及我将如何实现) 简而言之，我想做的是: POST 发生
java - 调用同步/等待？
谁能帮我理解这一点吗？如果我们有一个类: public class Sample{ public synchronized method1(){ //Line1 .... wait();
java - 等待 - 通知工作？
这是我编写的代码，用于测试 wait() 和 notify() 的工作。现在我有很多疑问。 class A extends Thread { public void run() { try
函数外的javascript变量(使用异步/等待)？
我有以下代码由于语法错误而无法运行(在异步函数外等待) 如何使用 await 定义变量并将其导出？当我这样定义一个变量并从其他文件导入它时，该变量是只创建一次(第一次读取文件时？)还是每次导入时都创
Java 等待/通知全部
一个简单的线程程序，其中写入器将内容放入堆栈，读取器从堆栈中弹出。 java.util.Stack; import java.util.concurrent.ExecutorService; impo

首页

博学

6Ren·AI

商城

c++ - array_view.synchronize_asynch 会等待 parallel_for_each 完成吗？