gpt4 book ai didi

c - 为什么我不能将结构中的数据正确复制到 openCL cl_mem 缓冲区?

转载 作者:太空狗 更新时间:2023-10-29 15:07:36 26 4
gpt4 key购买 nike

好的,所以我将其分解为一个非常具体的问题。

我的印象是您可以将数组缓冲区中的任何类型的数据传递给 OpenCL;整数、字符、您自己的自定义结构,只要它只是数据并且不包含指向 GPU 无法检索的堆对象的指针。

现在,我已经试过了,我认为它适用于大量的整数数组,但不适用于我的结构数组。具体来说,

cl_mem log_buffer = clCreateBuffer(context, CL_MEM_READ_WRITE, 
num_elements * sizeof(int), NULL, NULL);

int* error_codes_in = (int*)malloc(num_elements * sizeof(int));

for (i = 0; i < num_elements; i++) {
error_codes_in[i] = i;
}

error = clEnqueueWriteBuffer(command_queue, log_buffer, CL_TRUE,
0, num_elements * sizeof(int), error_codes_in, 0, NULL, NULL);

这工作正常,我在 GPU 上获得了一个数字数组,并且可以成功地并行操作它们。

但是,当我使用自己的自定义结构时:

typedef struct {
float position[2];
float velocity[2];
float radius;
float resultant_force[2];
} ocl_element_2d_t;

(也定义在内核中,as)

const char* kernel_string = 
"typedef struct { float position[2]; float velocity[2]; float radius; float resultant_force[2]; } ocl_element_2d_t;"...

并且我使用相同/非常相似的代码来写入我的结构数组的 GPU 版本:

cl_mem gpu_buffer = clCreateBuffer(context, CL_MEM_READ_WRITE,
num_elements * sizeof(ocl_element_2d_t), NULL, NULL);

error = clEnqueueWriteBuffer(command_queue, (cl_mem)gpu_buffer, CL_TRUE,
0, num_elements * sizeof(ocl_element_2d_t), host_buffer, 0, NULL, NULL);

我在 GPU 中得到空白值,并且偶尔会为结构内的所有浮点值得到垃圾(350 中的三个或四个值)。两个返回值都是 CL_SUCCESS

关于我哪里出错的任何建议?我唯一的想法是 GPU 编译器在内存中生成一个具有不同间隙的结构,并且由于复制方法忽略了项目的内部结构并且只是复制了一个连续的 RAM block ,所以最终会出现不匹配和可能的异相项目。我的操作系统可能是 i7(四核)上的 64 位(OS X Lion),而我的 GPU 运行的是 32 位,这就是问题所在吗?它是 ATI Radeon HD 5750,不支持 double ,并声称拥有 128 位总线(可能相关也可能不相关,我不确切知道这些东西的含义。)

有正确的方法吗?对于结构中的不同属性,我是否必须全部使用 FORTRAN 并拥有 7 个不同的数组,每个数组都有自己的内核参数?

最佳答案

全部归功于@0A0D因为怀疑我的选择性代码示例。问题确实出在我未能正确初始化结构

我的借口很简单,我习惯于使用结构指针,而不是结构,所以这样写

ocl_element_2d_t element = host_buffer[i];
element.position[0] = 1.2;
element.position[1] = 5.7;

是向对象添加属性的标准方法。快速搜索结构后,我发现了一个非常非常基础的 C 教程,http://www.asic-world.com/scripting/structs_c.html其中指出

struct_instance = other_struct_instance;

执行深拷贝,而不是引用拷贝。

因此,当我测试 local 结构变量的输出时,我期望的值就在那里,但仍远不及 host_buffer 中的数组。 .

这里大概有两个教训:

  1. 确保在提出 StackOverflow 问题时发布所有相关代码(包括所有初始化),以便考虑所有可能的问题。
  2. 在使用库时,尤其是像 OpenCL 这样复杂的库,不要假设它的开发人员会犯愚蠢的错误——它们几乎肯定是您自己犯的!

关于c - 为什么我不能将结构中的数据正确复制到 openCL cl_mem 缓冲区?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7675347/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com