gpt4 book ai didi

c - 来自错误的 OpenCL 2.0 内核的段错误

转载 作者:太空宇宙 更新时间:2023-11-04 02:44:16 25 4
gpt4 key购买 nike

我正在尝试学习 OpenCL 2.0 的新功能,并且我创建了一个小内核以尝试演示设备端排队。内核如下:

#pragma OPENCL EXTENSION cl_amd_printf : enable

__kernel void call_me(__global int *a);

__kernel void templateKernel(__global unsigned int * output,
__global unsigned int * input,
const unsigned int multiplier);


__kernel void call_me(__global int *a)
{
//do nothing
int id = get_global_id(0);
//a[id] = b[id];
}



__kernel void templateKernel(__global unsigned int * output,
__global unsigned int * input,
const unsigned int multiplier)
{
uint tid = get_global_id(0);
int lid = get_local_id(0);
int gid = get_group_id(0);
int broadcast = 1;
int global_size = get_global_size(0);
if(gid == 0) {
broadcast = work_group_broadcast(5, 0);
}
int collection = work_group_scan_exclusive_add(broadcast);


void (^kernel_block)(void) = ^{call_me(input);};
//output[tid] = input[tid] * multiplier + collection + broadcast;
output[tid] = collection;
//output[tid] = global_size;
size_t size = 100;
//printf("hey %d\n", broadcast);
ndrange_t ndrange = ndrange_1D(size);
queue_t default_queue = get_default_queue();
/*
if(tid == 0){
int status = enqueue_kernel(
default_queue,
CLK_ENQUEUE_FLAGS_WAIT_KERNEL,
ndrange,
kernel_block
);
}
*/
}

这个内核应该什么都不做,除了让它在内核中成功调用,不会导致程序段错误。它出什么问题了?当删除 enqueue_kernel 调用时,段错误也会被删除。我的 OpenCL C 编译器设置为 --cl-std=CL2.0 并确认可以正常工作,因为广播和收集功能正常工作。

我正在使用 AMDAPPSDK 3.0 Beta。任何帮助表示赞赏。

最佳答案

我已经解决了我自己的问题。

问题是在 OpenCL 2.0 中,创建命令队列的 API 调用clCreateCommandQueue() 已被弃用。相反,AMD 建议应该使用新的 API 调用 clCreateCommandQueueWithProperties() 以便为设备端内核调用启用设备端队列。

除了使用新的 API 调用外,还必须至少创建 2 个命令队列。一种用于主机端,一种用于设备端。设备队列是在主机中创建的,使用新 API 调用附带的附加属性。

关于c - 来自错误的 OpenCL 2.0 内核的段错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28973475/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com