gpt4 book ai didi

c++ - 将结构的动态数组传递给 GPU 内核

转载 作者:行者123 更新时间:2023-11-30 00:49:00 25 4
gpt4 key购买 nike

我尝试将我的动态结构数组传递给内核,但它不起作用。我得到 - “段错误(核心已转储)”

我的代码 - 已编辑

#include <stdio.h>
#include <stdlib.h>

struct Test {
unsigned char *array;
};

__global__ void kernel(Test *dev_test) {
}

int main(void) {

int n = 4;
int size = 5;
unsigned char *array[size];
Test *dev_test;

// allocate for host
Test *test = (Test*)malloc(sizeof(Test)*n);
for(int i = 0; i < n; i++)
test[i].array = (unsigned char*)malloc(size);


// fill data
for(int i=0; i<n; i++) {
unsigned char temp[] = { 'a', 'b', 'c', 'd' , 'e' };
memcpy(test[i].array, temp, size);
}

// allocate for gpu
cudaMalloc((void**)&dev_test, n * sizeof(Test));
for(int i=0; i < n; i++) {
cudaMalloc((void**)&(array[i]), size * sizeof(unsigned char));
cudaMemcpy(&(dev_test[i].array), &(array[i]), sizeof(unsigned char *), cudaMemcpyHostToDevice);
}

kernel<<<1, 1>>>(dev_test);

return 0;
}

我应该如何正确分配 gpu 内存并将数据复制到该内存?

最佳答案

您需要为结构成员array 分配内存。

Test *test = malloc(sizeof(Test)*n);
for(int i = 0; i < n; i++)
test[i]->array = malloc(size);

我建议阅读 this answer处理此修复后的其他问题。

关于c++ - 将结构的动态数组传递给 GPU 内核,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30055147/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com