gpt4 book ai didi

gpu - 组织 CUDA 内核

转载 作者:行者123 更新时间:2023-12-04 20:05:50 30 4
gpt4 key购买 nike

我正在编写一个非常非常长的 CUDA 内核,它对人类的可读性来说非常糟糕。有什么方法可以用内核外部的功能组织 CUDA 内核吗?示例:

__global__ void CUDA_Kernel(int* a, int* b){
//calling function 1
//calling function 2
//calculation function
.......
}

最佳答案

如果函数是使用 __device__ 关键字定义的,则可以从内核内部调用该函数。

例如:

__device__ int test_fun(int val)
{
return 2*val + 3;
}


__global__ void kern_test( int * data)
{
int aOffset = blockDim.x * blockIdx.x + threadIdx.x;
data[offset] = test_fun(data[offset]);
}

关于gpu - 组织 CUDA 内核,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6522529/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com