gpt4 book ai didi

c++ - CUDA 使用 cudaMemcpy 复制多个结构数组

转载 作者:太空宇宙 更新时间:2023-11-04 06:33:33 25 4
gpt4 key购买 nike

假设一个带有一些基元的结构 X 和一个 Y 结构数组:

typedef struct 
{
int a;
Y** y;
} X;

X 的实例 X1 在主机上初始化,然后通过 cudaMemcpy 复制到设备内存上的 X 的实例 X2。

这适用于 X 中的所有基元(例如 int a),但 cudaMemcpy 似乎将任何双指针扁平化为单个指针,因此无论何时访问 X 中的结构数组(例如作为你)。

在这种情况下,我是否应该使用另一个 memcpy 函数,例如 cudaMemcpy2D 或 cudaMemcpyArrayToArray?

非常感谢您的建议。谢谢!

编辑

复制结构数组的自然方法(如“如果它只是 C,我会这样做)”将是 cudaMalloc 数组,然后是 cudaMalloc 并分别初始化每个元素,例如:

X** h_x;
X** d_x;
int num_x;

cudaMalloc((void**)&d_x, sizeof(X)*num_x);

int i=0;
for(;i<num_x;i++)
{
cudaMalloc((void**)d_x[i], sizeof(X));
cudaMemcpy(&d_x[i], &h_x[i], sizeof(X), cudaMemcpyHostToDevice);
}

但是,for 的 cudaMalloc 会产生崩溃。我承认我还不太习惯在 Cuda 函数中使用指针,所以也许我搞砸了 cudaMalloc 和 cudaMemcpy 参数?

最佳答案

cudaMemcpycudaMemcpy2DcudaMemcpyArrayToArray 都从主机中的连续内存区域复制到设备上的连续内存区域。

您必须将所有数据复制到发送到设备的中间连续缓冲区中。

关于c++ - CUDA 使用 cudaMemcpy 复制多个结构数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17778423/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com