gpt4 book ai didi

c - 在 OpenCL 中等待单个事件

转载 作者:太空狗 更新时间:2023-10-29 17:01:53 25 4
gpt4 key购买 nike

我正在编写一个 OpenCL 程序,其中多个内核在多个设备上被调用。在我将所有内核入队后,我想等到其中任何一个内核完成后,再为该设备入队工作。

例如,我有设备 A 和 B,它们每个都有一个内核。如果 A 先完成,我想在做一些工作后在其中加入一个新内核。如果 B 先完成,我想在做一些工作后为它排队一个新内核。我正在寻找类似 clWaitForAnyEvent 的东西,它将在传入的任何事件完成后返回。

查看规范,我看到了一个 clWaitForEvents 方法,但它似乎会等待所有事件完成后再继续,我想在一个事件后继续(并且需要知道哪个事件结束了)。

我现在能想到的选项是:

  1. 忙等待使用 clGetEventInfo 来测试事件是否完成。

  2. 多线程,每个事件都有一个线程(只需要几个线程,但我将 CPU 用作设备之一)

  3. 遗漏了规范中的一些内容,实际上有一种方法可以帮我做到这一点。

关于如何进行的任何建议或我缺少的东西?

谢谢!

最佳答案

你的答案是 3。

clWaitForEvents 将完全按照您的意愿进行。假设您有一个设备的命令队列,我们​​将其称为 klee_dev。您可以像这样在 klee_dev 上排队工作:

cl_event event;
cl_int status = clEnqueueNDRangeKernel(queue_for_klee_dev, ..., &event);

/* enqueue other work on other devices, perhaps even klee_dev */

clWaitForEvents(1, &event);

clWaitForEvents 的调用将阻塞,直到您在 klee_dev 的命令队列中排队的工作完成。它不会等待其他工作完成;仅由与该事件关联的入队调用指定的工作。

编辑:

我误解了原来的问题,下面已经澄清了。 OP 询问 CL 规范中是否有一种方法,在给定一组 事件的情况下,该方法将阻塞直到任何一个 事件完成。目前没有这种方法。

再次编辑:

您可以使用 clSetEventCallback 为每个事件注册一个回调方法。在回调中,您可以使用 clGetEventInfo 查询事件以找出与该事件关联的命令队列。

我认为这可以满足您的需求:任何事件完成的通知,以及找出与该事件关联的命令队列的能力。

关于c - 在 OpenCL 中等待单个事件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8117776/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com