c++ - OpenCL 程序未执行-6ren

c++ - OpenCL 程序未执行

转载作者：行者123 更新时间：2023-11-28 00:33:19

我稍微修改了this程序，但现在没有运行。这是我的代码:

#include <iostream>
#include "CL/cl.h"
#include <math.h>

using namespace std;
#define MYSIZE 1000

#if defined(cl_khr_fp64) //Khronos extension available
#pragma OPENCL EXTENSION cl_khr_fp64 : enable
#define DOUBLE_SUPPORT_AVAILABLE
#elif defined(cl_amd_fp64) //AMD extension available
#pragma OPENCL EXTENSION cl_amd_fp64 : enable
#define DOUBLE_SUPPORT_AVAILABLE
#endif

#ifdef DOUBLE_SUPPORT_AVAILABLE

//double
typedef double myreal;
const char *SOURCE = "\n" \
"__kernel void addArray(__global double *A, __global double *B, __global double *C, const unsigned int size) \n" \
"{                                                                                                           \n" \
    "int i = get_global_id(0);                                                                               \n" \
    "if(i < size)                                                                                            \n" \
        "    C[i] = A[i] + B[i];                                                                             \n" \
"}                                                                                                           \n" \
"\n";

#else

//float
typedef float myreal;
const char *SOURCE = "\n" \
"__kernel void addArray(__global float *A, __global float *B, __global float *C, const unsigned int size) \n" \
"{                                                                                                           \n" \
    "int i = get_global_id(0);                                                                               \n" \
    "if(i < size)                                                                                            \n" \
        "    C[i] = A[i] + B[i];                                                                             \n" \
"}                                                                                                           \n" \
"\n";

#endif

int main(int argc, char *argv[])
{
    int devType = CL_DEVICE_TYPE_GPU;
    unsigned int count = MYSIZE;
    cl_int err;//err returned from API
    size_t global;//global size
    size_t local;//local size
    cl_platform_id platform;
    cl_device_id device;
    cl_context context;
    cl_command_queue commands;
    cl_program program;
    cl_kernel kernel;

    //connect to a compute device
    err = clGetPlatformIDs(1, &platform, NULL);
    if(err != CL_SUCCESS)
    {
        cerr << "ERROR: Could not find a platform" << endl;
        return -1;
    }

    //get a device of the appropriate type
    err = clGetDeviceIDs(platform, devType, 1, &device, NULL);
    if(err != CL_SUCCESS)
    {
        cerr << "ERROR: Could not find a device" << endl;
        return -1;
    }

    //create a context
    context = clCreateContext(0, 1, &device, NULL, NULL, &err);
    if(!context || (err != CL_SUCCESS))
    {
        cerr << "ERROR: Could not create a context" << endl;
        return -1;
    }

    //create a command queue
    commands = clCreateCommandQueue(context, device, 0, &err);
    if(!commands || (err != CL_SUCCESS))
    {
        cerr << "ERROR: Could not create a command queue" << endl;
        return -1;
    }

    //create the compute program from source
    program = clCreateProgramWithSource(context, 1, (const char **) &SOURCE, NULL, &err);
    if(!program || (err != CL_SUCCESS))
    {
        cerr << "ERROR: Could not create a program from source" << endl;
        return -1;
    }

    //build the program executable
    err = clBuildProgram(program, NULL, NULL, NULL, NULL, NULL);
    if(err != CL_SUCCESS)
    {
        size_t len;
        char buffer[2048];
        clGetProgramBuildInfo(program, device, CL_PROGRAM_BUILD_LOG, sizeof(buffer), buffer, &len);

        cerr << "ERROR: Could not build the program executable" << endl;
        cerr << buffer << endl;
        return -1;
    }

    //create the kernel
    kernel = clCreateKernel(program, "addArray", &err);
    if(!kernel || (err != CL_SUCCESS))
    {
        cerr << "Could not create the kernel" << endl;
        return -1;
    }

    myreal *A = new myreal[MYSIZE];
    myreal *B = new myreal[MYSIZE];
    myreal *C = new myreal[MYSIZE];
    for(int i = 0; i < MYSIZE; i++)
    {
        A[i] = sqrt(i);
        B[i] = -sqrt(i);
    }
    unsigned int correct = 0;//correct answers
    cl_mem A_cl;
    cl_mem B_cl;
    cl_mem C_cl;

    //create device memory buffer
    A_cl = clCreateBuffer(context, CL_MEM_READ_ONLY, sizeof(myreal) * count, NULL, NULL);
    B_cl = clCreateBuffer(context, CL_MEM_READ_ONLY, sizeof(myreal) * count, NULL, NULL);
    C_cl = clCreateBuffer(context, CL_MEM_WRITE_ONLY, sizeof(myreal) * count, NULL, NULL);
    if(!A_cl || !B_cl || !C_cl)
    {
        cerr << "Could not create device memory buffer" << endl;
        return -1;
    }

    //transfer data to device
    err = clEnqueueWriteBuffer(commands, A_cl, CL_TRUE, 0, sizeof(myreal) * count, A, 0, NULL, NULL);
    if(err != CL_SUCCESS)
    {
        cerr << "Could not transfer data to device" << endl;
        return -1;
    }

    err = clEnqueueWriteBuffer(commands, B_cl, CL_TRUE, 0, sizeof(myreal) * count, B, 0, NULL, NULL);
    if(err != CL_SUCCESS)
    {
        cerr << "Could not transfer data to device" << endl;
        return -1;
    }

    //set the arguments to the compute kernel
    err = 0;
    err = clSetKernelArg(kernel, 0, sizeof(cl_mem), &A_cl);
    err |= clSetKernelArg(kernel, 1, sizeof(cl_mem), &B_cl);
    err |= clSetKernelArg(kernel, 2, sizeof(cl_mem), &C_cl);
    err |= clSetKernelArg(kernel, 3, sizeof(unsigned int), &count);
    if(err != CL_SUCCESS)
    {
        cerr << "Could not set args for kernel" << endl;
        return -1;
    }

    //get max work group size
    err = clGetKernelWorkGroupInfo(kernel, device, CL_KERNEL_WORK_GROUP_SIZE, sizeof(local), &local, NULL);
    if(err != CL_SUCCESS)
    {
        cerr << "Could not get the kernel work group size" << endl;
        return -1;
    }

    //execute the kernel using max work group size
    global = count;
    err = clEnqueueNDRangeKernel(commands, kernel, 1, NULL, &global, &local, 0, NULL, NULL);
    if(err != CL_SUCCESS)
    {
        cerr << "Could not enqueue the kernel for execution: " << err << endl;
        return -1;
    }

    //wait for all commands to finish
    clFinish(commands);

    //read back the results to C
    err = clEnqueueReadBuffer(commands, C_cl, CL_TRUE, 0, sizeof(myreal) * count, C, 0, NULL, NULL);
    if(err != CL_SUCCESS)
    {
        cerr << "Could not read data from C" << endl;
        return -1;
    }

    //validate the results
    correct = 0;
    myreal check = 0;
    for(int i = 0; i < MYSIZE; i++)
    {
        check = A[i] + B[i] - C[i];
        if((check < 1e-14) && (check > -1e-14))
            correct++;
    }

    cout << "Computed " << correct << " correct results with " << ((correct / MYSIZE) * 100) << "% success rate!" << endl;
    delete[] A;
    delete[] B;
    delete[] C;

    clReleaseMemObject(A_cl);
    clReleaseMemObject(B_cl);
    clReleaseMemObject(C_cl);
    clReleaseProgram(program);
    clReleaseKernel(kernel);
    clReleaseCommandQueue(commands);
    clReleaseContext(context);

    return 0;

    return 0;
}

我得到的输出是:

Could not enqueue the kernel for execution: -54

这个错误-54是什么意思？

我在 Windows7 64 位上使用 MinGW 4.4 32 位编译器。我的 GPU 是 ATI Radeon 7670m，它有 OpenCL 1.1 驱动程序。我正在使用适用于 64 位的 APP SDK 2.9。

最佳答案

在 Khronos 引用 cl.h 中，-54 表示 CL_INVALID_WORK_GROUP_SIZE，相当 self 解释。

提示:如果您对工作组大小没有限制，那么您可以传递 NULL 而不是 local 并让入队函数为您计算出来。

关于c++ - OpenCL 程序未执行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21968036/

文章推荐： c++ - 如何删除尚未分配给对象的指针

文章推荐： c++ - argc 的值永远不会超过 2

文章推荐： c++ - SFML 帮助(使用中的 Sleep 函数)

macos - 执行 wine != 执行 `which wine`
我有一个“有趣”的问题，即以两种不同的方式运行 wine 会导致: $> wine --version /Applications/Wine.app/Contents/Resources/bin/wi
javascript - CRONTAB 执行 Python，使用 puppeteer 执行 Node 来进行网页抓取不起作用
我制作了这个网络抓取工具来获取网页中的表格。我使用 puppeteer (不知道 crontab 有问题)、Python 进行清理并处理数据库的输出但令我惊讶的是，当我执行它时 */50 * * *
javascript - 对 javascript 函数的 Objective-C 调用何时被调用/执行，何时不被调用/执行？
JavaScript 是否被调用或执行取决于什么？准确地说，我有两个函数，它们都以相同的方式调用: [self.mapView stringByEvaluatingJavaScriptFromStri
python - 为什么使用 statsmodels 执行 OLS 和使用 scikit 执行 PooledOLS 时会得到相同的结果？
我目前正在使用 python 做一个机器学习项目(这里是初学者，从头开始学习一切)。只是想知道 statsmodels 的 OLS 和 scikit 的 PooledOlS 使用我拥有的相同面板数据
c# - 通过 Enterprise Guide 执行 SAS 和从 .Net 执行 IOM 之间的区别
在使用集成对象模型 (IOM) 后，我可以执行 SAS 代码并将 SAS 数据集读入 .Net/C# 数据集 here . 只是好奇，使用 .Net 作为 SAS 服务器的客户端与使用 Enterpr
javascript - jQuery 不会使用 animate : top 200px function. 执行，但它会使用 animate: height 执行
有一些直接的 jQuery 在单击时隐藏打开的 div 未显示，但仍将高度添加到导航中以使其看起来好像要掉下来了。这个脚本工作正常: $(document).ready(funct
java - 为什么我的代码使用 'IF' 执行 'ELSE' 和 '==' ，但不使用 '.equals' 执行？
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 4 年前。这里是 Java 新手，我正在使用 NetBeans 尝试一些简单的代
python - Keras 2.0.8 仅使用 Python 3.x 执行 1 个 epoch，使用 2.x 执行 10 个
如果我将它切换到 Python 2.x，它执行 10。这是为什么？训练逻辑回归模型 import keras.backend as
JavaScript 执行
我有两个脚本，它们包含在 HTML 正文中。在第一个脚本中，我初始化一个 JS 对象，该对象在第二个脚本标记中引用。 ... obj.a = 1000; obj.
执行@number时的Java链接列表错误消息
每当我运行该方法时，我都会收到一个带有数字的错误以下是我的代码。 public String getAccount() { String s = "Listing the accounts";
java - 执行 while 循环以显示菜单
我已经用 do~while(true) 创建了我的菜单；但是每次用户输入一个数字时，它不会运行程序，而是再次显示菜单!你怎么看？ //我的主要方法 public static void main(St
ipython - 执行/命令完成时通知
执行命令后，如何让IPython通知我？我可以使用铃声/警报还是通过弹出窗口获取它？我正在OS X 10.8.5的iTerm上运行Anaconda。最佳答案使用最新版本的iTerm，您可以在she
java - Swing 执行
您好，我刚刚使用菜单栏为 Swing 编写了代码。但是问题出现在运行中。我输入: javac Menu.java java Menu 它没有给出任何错误，但 GUI 没有显示。这是我的源代码以供引用:
.net - 执行.NET应用程序时验证Authenticode签名
我觉得这里缺少明显的东西，但是我看不到它写在任何地方。我使用Authenticode证书对可执行文件进行签名，但是当我开始学习有关它的更多信息时，我对原样的值(value)提出了质疑。签名的exe
按钮单击事件上的 JavaScript 执行
我正在设计一个应用程序，它使用 DataTables 中的预定义库来创建数据表。我想对数据表执行删除操作，为此应在按钮单击事件上执行 java 脚本。 $(document).ready(functi
Haskell - 执行 while 循环
我是 Haskell 新手，如果有人愿意帮助我，我会很高兴!我试图让这个程序与 do while 循环一起工作。第二个 getLine 命令的结果被放入变量 goGlenn 中，如果 goGlenn
java - 执行 while 循环时出现问题
我有一个用 swing 实现迷你游戏的程序，在主类中我有一个循环，用于监听游戏 map 中的 boolean 值。使用 while 实现的循环不会执行一条指令，如果它是唯一的一条指令，我不知道为什么。
java - 执行.jar时将OJBDC添加到类路径
我正在尝试开发一个连接到 Oracle 数据库并执行函数的 Java 应用程序。如果我在 Eclipse 中运行该应用程序，它可以工作，但是当我尝试在 Windows 命令提示符中运行 .jar 时，
java future 执行
我正在阅读有关 Java 中的 Future 和 javascript 中的 Promises 的内容。下面是我作为示例编写的代码。我的问题是分配给 future 的任务什么时候开始执行？当如下行创
java - 执行 && 最有效的方法？
我有一个常见的情况，您有两个变量(xSpeed 和 ySpeed)，当它们低于 minSpeed 时，我想将它们独立设置为零，并在它们都为零时退出。最有效的方法是什么？目前我有两种方法(方法2更干净

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - OpenCL 程序未执行