c++ - 如何使用 OpenCL C++ 绑定(bind)获得最大的全局工作量？-6ren

c++ - 如何使用 OpenCL C++ 绑定(bind)获得最大的全局工作量？

转载作者：行者123 更新时间：2023-11-30 03:24:03

26

4

我想获得最大的全局工作量。我不想要一个内核 OpenCL 会尝试为您选择最好的一个，它可能是也可能不是最大大小。

为此，我想在调用 clEnqueueNDRangeKernel 时指定大小。例如:

clEnqueueNDRangeKernel(queue, kernel, 1, NULL, &global_size, NULL, 0, NULL, NULL);

clGetKernelWorkGroupInfo documentation , 表示:

CL_KERNEL_GLOBAL_WORK_SIZE:这为应用程序提供了一种机制，可以查询可用于在由设备或内置内核提供的自定义设备上执行内核的最大全局大小(即 clEnqueueNDRangeKernel 的 global_work_size 参数)设备提供的 OpenCL 设备。

如何使用 OpenCL C++ 绑定(bind)获得 CL_KERNEL_GLOBAL_WORK_SIZE？

我这样做

cl::array<size_t, 3> kernel_global_work_size = my_kernel.getWorkGroupInfo<CL_KERNEL_GLOBAL_WORK_SIZE>(my_device);

但是我得到了错误:

cl2.hpp:5771:12: note: candidate: template<class T> cl_int cl::Kernel::getWorkGroupInfo(const cl::Device&, cl_kernel_work_group_info, T*) const
     cl_int getWorkGroupInfo(
            ^~~~~~~~~~~~~~~~
cl2.hpp:5771:12: note:   template argument deduction/substitution failed:
cl2.hpp:5782:9: note: candidate: template<int name> typename cl::detail::param_traits<cl::detail::cl_kernel_work_group_info, name>::param_type cl::Kernel::getWorkGroupInfo(const cl::Device&, cl_int*) const
         getWorkGroupInfo(const Device& device, cl_int* err = NULL) const

用这段代码

cl::array<size_t, 3> kernel_global_work_size;
my_kernel.getWorkGroupInfo<cl::array<size_t, 3>>(my_device, CL_KERNEL_GLOBAL_WORK_SIZE, &kernel_global_work_size);

我收到 OpenCL 错误 -30(无效值)

my_kernel 不是内置内核例如:cl::Kernel my_kernel = cl::Kernel(program, "my_kernel");my_device 不是自定义设备。例如:cl::Device device = myDevices[0];

最佳答案

是的，因为您的调用与签名匹配:

https://github.khronos.org/OpenCL-CLHPP/classcl_1_1_kernel.html

template <cl_int name> typename
detail::param_traits<detail::cl_kernel_work_group_info, name>::param_type getWorkGroupInfo(const Device& device, cl_int* err = NULL) const;

它看起来像 param_traits这是通过宏生成的，没有为 CL_KERNEL_GLOBAL_WORK_SIZE 声明.那将是标题中的错误。 ( GitHub issue created by OP )

对于一些条目 here缺少条目 here.

或者，您可以使用返回错误代码的版本，以及通过输出参数提供的信息，这应该可以解决该问题:

template<typename T>
cl_int getWorkGroupInfo(const Device &device, cl_kernel_work_group_info name, T *param) const;

调用可能如下所示:

cl::array<size_t, 3> result;
kernel.getWorkGroupInfo<decltype(result)>(device, CL_KERNEL_GLOBAL_WORK_SIZE, result);

我的问题是:您自己尝试过吗？结果不符合你的预期吗？

您收到 CL_INVALID_VALUE 了吗？

[...] on a custom device given by device or a built-in kernel on an OpenCL device given by device.

If device is not a custom device or kernel is not a built-in kernel, clGetKernelArgInfo returns the error CL_INVALID_VALUE.

参见 OpenCL 1.2 spec , 第 14 和 15 页:

Built-in Kernel: A built-in kernel is a kernel that is executed on an OpenCL device or custom device by fixed-function hardware or in firmware. Applications can query the built-in kernels supported by a device or custom device. A program object can only contain kernels written in OpenCL C or built-in kernels but not both. See also Kernel and Program.

Custom Device: An OpenCL device that fully implements the OpenCL Runtime but does not support programs written in OpenCL C. A custom device may be specialized non- programmable hardware that is very power efficient and performant for directed tasks or hardware with limited programmable capabilities such as specialized DSPs. Custom devices are not OpenCL conformant. Custom devices may support an online compiler. Programs for custom devices can be created using the OpenCL runtime APIs that allow OpenCL programs to be created from source (if an online compiler is supported) and/or binary, or from built-in kernels supported by the device. See also Device.

对于常规内核和设备，标准限制了工作组大小(设备属性)，而全局大小仅受使用范围限制 size_t 。参见 clEnqueueNDRangeKernel .

关于c++ - 如何使用 OpenCL C++ 绑定(bind)获得最大的全局工作量？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50044493/

26

4

0

文章推荐： c++ - 从虚方法返回派生对象指针

文章推荐： android - 使用预定义的度量以编程方式扩展 View

文章推荐： android - 在表布局中克隆行

文章推荐： c++ - 通用指数退避重试机制 C++11

python - 获得 Mechanize 和斜纹布说话
我正在为我的雇主编写脚本，以从他们自己的站点获取某些数据。出于一长串原因，我需要从网站上获取数据，如图所示。我发现，其中一些数据是通过 js 调用检索的... 回想起来，我应该选择 Mechanize
cryptography - 获得 ECDSA 签名的固定长度字节表示的正确方法是什么？
我正在使用 python 和 cryptography.io 来签署和验证消息。我可以通过以下方式获得签名的 DER 编码字节表示: cryptography_priv_key.sign(messag
licensing - 获得 GPLv2 许可的库能否用于专有应用程序？
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 6年前关闭。 Improve thi
r - 获得 ECDF 的导数
是否可以区分 ECDF？以下面得到的为例。 set.seed(1) a <- sort(rnorm(100)) b <- ecdf(a) plot(b) 我想对 b 求导以获得它的概率密度函数 (PD
Javascript 获得 MIME 类型支持
我找到了如何从 navigator.mimeTypes 获取 mimetypes: function GetMimeTypes() { var message = ""; var mi
Javascript 添加的表单元素无法通过 $_POST 获得
我在表单中使用单选按钮来隐藏/显示联系人表单中的成员 ID 字段。问题是，当 javascript 更改 html 中包含的隐藏 id 字段(该字段设置为“无”值)时，该字段将不再通过 post 可用
c++ - 如何从snprintf()获得-1
我正在做单元测试。我必须测试所有可能的if..else情况。但是在此if语句中: int32_t i32Res = snprintf(buffer, len, "The%d_String_%d", 0
facebook - 获得 Facebook 应用页面的总点赞数
我有一个 Facebook 应用程序，我想从中获取“喜欢”的总数。我想知道这是否可能。其中 ID 是应用程序的 ID，ACCESS_TOKEN 是我尝试过的应用程序的当前访问 token : gra
azure - 获得 blob 的多个租约
如果我有多个计算实例尝试同时获取同一个 blob 的租约，则似乎经常会成功。我的印象是，一旦租约发出(并因此被客户获得)，就不可能同时发出另一个租约？我希望情况确实如此，我一直在 Azure 中使用
elasticsearch - elasticsearch-获得 'function_score'内的中级分数
这是我的索引 POST /blogs/1 { "name" : "learn java", "popularity" : 100 } POST /blogs/2 { "name" : "l
symfony - 获得 Symfony2 中的最高用户角色
我正在将 Symfony2 与 FOSUserBundle 一起使用。我需要为用户获得最高角色。 role_hierarchy: ROLE_CONTRIBUTOR: ROLE_USER
java - 获得 REST 请求的快速响应
我正在向服务器发送基于 REST 的请求。我希望尽快得到答复，并希望了解可以进行的各种优化。一种方法当然是在线程中并行发送这些请求。还有哪些其他选项可用于优化此功能？在服务器上，可以添加哪些配置？
java - 获得 HEAD 之上的提交
这可能是某种重复的问题，但我似乎找不到合适的解决方案。我正在使用 git4idea.history.GitHistoryUtils.history() 获取提交列表。如果 checkout 其中一个较
c - 获得 centavos 或小数点后两位的公式是什么？
我正在做一个程序，可以输入每周的工资和那一周的总工作时间。它应该以小时工资率显示答案。但是我无法显示正确的“centavos/2 decimal places”公式并且它不想使用 float % fl
c - 获得 2 的幂相关结果的优雅方法
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便
android - 获得 Looper 的最佳做法是什么？
我已经尝试了 mContext.getMainLooper() 和 Looper.getMainLooper()。两者都返回相同的结果，但我想知道哪种方法正确？我还从 Android 开发人员链接中
mySQL 获得 n 级附属机构
我有一个“affiliates”表，其中包含“user”和“referredBy”列。给定一个用户，我希望获得该用户推荐的所有“n 级”玩家。对于 n=1，我们只关心您直接推荐的玩家数量: SELE
sql - 获得 10 个不同的项目以及相关任务的最新更新
我在 PostgreSQL 9.5 数据库中有两个表: project - id - name task - id - project_id - name - updated_
PHP Iplode 获得 IN 查询的预期结果
请帮助我怎样才能得到我预期的结果，在此先感谢并抱歉我的英语不好。 PHP: $dog = implode(',', $data['dogbreed']); $query .= "AND `do
ios - 获得 CGVector 的负数
我有 let impulse = CGVectorMake(CGFloat(Constants.impulse), 0) 如何在不创建另一个 CGVector 的情况下得到它的负值？我正在考虑在 C

首页

博学

6Ren·AI

商城

c++ - 如何使用 OpenCL C++ 绑定(bind)获得最大的全局工作量？