gpt4 book ai didi

cuda - 在 GPU 上动态分配内存

转载 作者:行者123 更新时间:2023-12-04 17:12:54 69 4
gpt4 key购买 nike

是否可以在内核内部的 GPU 全局内存上动态分配内存?
我不知道我的答案有多大,因此我需要一种方法来为答案的每个部分分配内存。 CUDA 4.0 允许我们使用 RAM ......这是一个好主意还是会降低速度?

最佳答案

可以在内核中使用 malloc。检查以下取自 nvidia cuda 指南:

__global__ void mallocTest() 
{
char* ptr = (char*)malloc(123);
printf(“Thread %d got pointer: %p\n”, threadIdx.x, ptr);
free(ptr);
}
void main()
{
cudaThreadSetLimit(cudaLimitMallocHeapSize, 128*1024*1024);
mallocTest<<<1, 5>>>();
cudaThreadSynchronize();
}

will output:
Thread 0 got pointer: 00057020
Thread 1 got pointer: 0005708c
Thread 2 got pointer: 000570f8
Thread 3 got pointer: 00057164

关于cuda - 在 GPU 上动态分配内存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5248726/

69 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com