gpt4 book ai didi

c++ - make for ( rowIdx = 1...) 使用 cuda 线程工作

转载 作者:行者123 更新时间:2023-11-30 19:20:26 24 4
gpt4 key购买 nike

我用 C++ 编写了这个

for ( rowIdx = 1; rowIdx < (NbRows - 1); rowIdx++ )

为了使用cuda来做到这一点,我应该如何处理?

因为在 cuda 中我们这样做:

if (rowIdx < ArraySize) ...

如果我设置rowIdx=1在调用if (rowIdx < ArraySize)之前,它不起作用。

----更新----------------------------------------

一个简单的示例来说明。

__global__ void test_func(int *a_in,int *b_in,int *c_out)
{

size_t rowIdx = blockIdx.x * blockDim.x + threadIdx.x;
rowIdx=1;

if (rowIdx <ARRAY_SIZE)
c_out[rowIdx]=a_in[rowIdx]*b_in[rowIdx];


}

//fill matrices
for (int i=0;i<ARRAY_SIZE;i++){

a_in[i]=i;
b_in[i]=i+1;
c_out[i]=0;

}

如果我使用rowIdx=1 ,那么我只正确地取第一个结果。其余的都是零。

最佳答案

为了用示例中提供的给定功能简单替换 for 循环,内核可以看起来像这样。

__global__ void test_func(int *a_in,int *b_in,int *c_out)
{
size_t rowIdx = blockIdx.x * blockDim.x + threadIdx.x;

if (rowIdx > 0 && // ensure that rowIdx is at least 1
rowIdx <ARRAY_SIZE) // ensure that rowIdx is not out of bounds
{
c_out[rowIdx]=a_in[rowIdx]*b_in[rowIdx];
}
}

所有线程都将计算从索引 1ARRAY_SIZE-1 的不同数组元素。请注意,在这种情况下,不会计算“真实”第一个元素 c_out[0]

关于c++ - make for ( rowIdx = 1...) 使用 cuda 线程工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22222519/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com