gpt4 book ai didi

c++ - OpenCl 内核代码

转载 作者:塔克拉玛干 更新时间:2023-11-03 07:11:49 25 4
gpt4 key购买 nike

我是 OpenCL 的新手(今天开始)。我很难实现以下列方式添加数组数字的内核代码:如果A[]=[1,2,3,4,5,6,7,8,9,10],那么求和应该是sum[]=[4,10,16];

i.e, sum[i]=A[i]+A[i+2]; 
i=i+3;

我试过下面的代码,但它似乎不起作用。

std::string kernel_code =
" void kernel simple_add(global const int* A, global const int* B, global int* C){ "
" int x =0;"
" int i =get_global_id(0);"
" SUM[x]=A[i]+A[i+2];"
" i=i+3;
" x++;"
" } ";

我敢肯定这不是解决问题的方法。在这方面的建议将不胜感激。

最佳答案

您应该计算 i,就好像该工作项是集合中的唯一一个一样。 gid 是工作项的全局 ID,我需要是它的三倍。您也不需要在使用后修改 gid 或 i。这不是最优的,但它会给你正确的答案。

void kernel simple_add(global const int* A, global const int* SUM){
int gid = get_global_id(0);
int i = gid * 3;
SUM[gid]=A[i]+A[i+2];
}

关于c++ - OpenCl 内核代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40136297/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com