c++ - 在 CUDA 中将动态分配的二维数组从主机复制到设备-6ren

c++ - 在 CUDA 中将动态分配的二维数组从主机复制到设备

转载作者：塔克拉玛干更新时间：2023-11-03 07:55:08

39

4

我想将动态分配的二维数组从主机复制到设备以获取其离散傅里叶变换。

我正在使用下面的代码将数组复制到设备

cudaMalloc((void**)&array_d, sizeof(cufftComplex)*NX*(NY/2+1));
cudaMemcpy(array_d, array_h, sizeof(float)*NX*NY, cudaMemcpyHostToDevice);

这适用于静态数组，我从我的 fft 得到了预期的输出。但它不适用于动态数组。经过一番搜索后，我了解到我无法将这样的动态数组从主机复制到设备。所以我找到了这个解决方案。

cudaMalloc((void**)&array_d, sizeof(cufftComplex)*NX*(NY/2+1));
for(int i=0; i<NX; ++i){
    cudaMemcpy(array_d+ i*NY, array_h[i], sizeof(float)*NY, cudaMemcpyHostToDevice);
}

但它也没有正确完成任务，因为我从我的 fft 中得到了错误的值。

下面是我的 fft 代码。

cufftPlanMany(&plan, NRANK, n,NULL, 1, 0,NULL, 1, 0,CUFFT_R2C,BATCH);
cufftSetCompatibilityMode(plan, CUFFT_COMPATIBILITY_NATIVE);
cufftExecR2C(plan, (cufftReal*)data, data);
cudaThreadSynchronize();
cudaMemcpy(c, data, sizeof(float)*NX*NY, cudaMemcpyDeviceToHost);

我怎样才能克服这个问题？

编辑

下面是代码

#define NX 4
#define NY 5
#define NRANK 2
#define BATCH 10

#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <cufft.h>
#include <stdio.h> 
#include <iostream>

int check();

int main()
    { 


    // static array
    float b[NX][NY] ={ 
        {0.7943 ,   0.6020 ,   0.7482  ,  0.9133  ,  0.9961},
        {0.3112 ,   0.2630 ,   0.4505  ,  0.1524  ,  0.0782},
         {0.5285 ,   0.6541 ,   0.0838  ,  0.8258  ,  0.4427},
         {0.1656 ,   0.6892 ,   0.2290  ,  0.5383  ,  0.1067}
        };

    // dynamic array
    float **a = new float*[NX];     
    for (int r = 0; r < NX; ++r)  
        {
        a[r] = new float[NY];
        for (int c = 0; c < NY; ++c)
            {            
                a[r][c] = b[r][c];           
            }
        }

    // arrray to store the results - host side   
    float c[NX][NY] = { 0 };

    cufftHandle plan;
    cufftComplex *data;
    int n[NRANK] = {NX, NY};

    cudaMalloc((void**)&data, sizeof(cufftComplex)*NX*(NY/2+1));
    cudaMemcpy(data, b, sizeof(float)*NX*NY, cudaMemcpyHostToDevice);

    /* Create a 2D FFT plan. */
    cufftPlanMany(&plan, NRANK, n,NULL, 1, 0,NULL, 1, 0,CUFFT_R2C,BATCH);
    cufftSetCompatibilityMode(plan, CUFFT_COMPATIBILITY_NATIVE);
    cufftExecR2C(plan, (cufftReal*)data, data);
    cudaThreadSynchronize();
    cudaMemcpy(c, data, sizeof(float)*NX*NY, cudaMemcpyDeviceToHost);

    cufftDestroy(plan);
    cudaFree(data);

    return 0;
    }

最佳答案

data 属于 cufftComplex 类型，它是一系列最终生成 float2 的 typedef。这意味着 data + n 会将 data 推进 n 类型 float2 的对象，或 2 * n float 类型的对象。这使您的“动态数组”复制不正确；你必须将 data 的增量减半。

编辑

查看 cufftExecR2C() 的参数类型，我认为这应该可行:

for(int i=0; i<NX; ++i){
  cudaMemcpy(reinterpret_cast<float*>(data) + i*NY, a[i], sizeof(float)*NY, cudaMemcpyHostToDevice);
}

旁注:您实际上没有动态二维数组(即 new float[NX * NY])。您拥有的是指向动态 float 组的指针的动态数组。我相信您改用真正的二维数组会更有意义，这样您也可以保留静态大小写复制代码。

既然你已经标记了这个 C++，你应该认真考虑使用 std::vector 而不是手动管理你的动态内存。也就是说，像这样更改 a:

std::vector<float> a(NX * NY);

当您使用它时，我建议将 NX、NY 等从宏转换为常量:

const size_t NX = 4;
const size_t NY = 5;

等等

关于c++ - 在 CUDA 中将动态分配的二维数组从主机复制到设备，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20797779/

39

4

0

文章推荐： c++ - 从 C++ 调用 Fortran 子程序

文章推荐： c++ - BB 10 Cascades 互联网检查

文章推荐： C++ 将多维数组传递给函数

mysql - 前台的 ssh 隧道适用于 mysql 主机 localhost，但后台的 ssh 隧道适用于 mysql 主机 127.0.0.1
我在这里想做的是将所有连接转发到机器一上端口 3306 上的本地主机到本地主机上端口 3306 上的机器二。因此，如果您连接到机器一上的 mysql，它的行为就像您正在连接一样在二号机器上。我认为
elasticsearch - 如何获得KIbana连接到的弹性IP/主机
通过Kibana界面，如何获得 flex IP /主机？我的意思是，与kibana连接的Elastic主机。那有可能吗？我在这个上挣扎了好几个小时，却一无所获:( 附:不确定此问题是否是题外话，应
deno - 如何关闭计算机(主机)
我知道这听起来很奇怪，但我有一个情况，Deno 需要关闭自己的主机(并因此杀死自己的进程)。这可能吗？我特别需要这个用于 linux (lubuntu)，如果相关的话。我想这需要 sudo 权限，这
deno - 如何关闭计算机(主机)
我知道这听起来很奇怪，但我有一个情况，Deno 需要关闭自己的主机(并因此杀死自己的进程)。这可能吗？我特别需要这个用于 linux (lubuntu)，如果相关的话。我想这需要 sudo 权限，这
Android: Activity 主机？
我有一个基本问题，但谷歌并没有为我产生很多结果(反正不是英文的)。基本上我想做的就是: 我有一个图形需要用作整个应用程序的持久 header ，例如:我不能让它在新的 Intent 调用时从屏幕上滑出
找不到 phpmyadmin 主机!
您好，我正在使用 xampp，我正在尝试使用 php 进行连接。 $sql_connections = mysql_connect("$server, $username, $password")
Java websocket 主机？
我目前正在尝试一些多人游戏的想法，并正在尝试创建一个 Java 应用程序来为基于网络浏览器的多人游戏提供服务。我的开发环境是主机上的Eclipse， native 上的notepad + Googl
SSH只能用于远程Linux 主机？那说明你见识太少了！
今天为大家分享一篇关于SSH 的介绍和使用方法的文章。本文从SSH是什么出发，讲述了SSH的基本用法，之后在远程登录、端口转发等多种场景下进行独立的讲述，希望能对大家有所帮助。什么是SSH？
kubernetes - 如何生成配置以连接到远程 Kubernetes 主机
我已经完成了在裸机 Centos 7 上运行的测试 Kubernets 主机的设置。这将用作测试系统，因为我们将在 IBM Bluemix Kubernetes 服务中部署所有内容。从 Bluemi
android - 适用于安卓的 USB 主机
我正在尝试通过带有 4.2(果冻 bean )的 android 设备“nexus 7”通过 USB 与我的 freeduino 板进行通信，该板类似于 arduino uno。几个月后，我使用开发
上游的 Nginx 主机 header
我正在使用 nginx，但在设置反向代理时遇到问题。我的 nginx.conf 是默认的(没有对其进行任何更改)，我的站点可用配置是: upstream backend_hosts { se
svn - 如何将我的项目文件上传到在线 svn 主机？
我在 projectlocker(免费 svn 主机)上有一个帐户，但我不知道如何将我的项目文件上传到它。我在我的仪表板中找不到任何选项。我在我的电脑上使用tortoiseSvn，那么如何上传文件
function - 主机.json；批量大小的含义
设置batchSize = 1有意义吗？如果我想一次处理一个文件？尝试过batchSize = 1000和batchSize = 1 - 似乎具有相同的效果 { "version": "2.0"
docker - 我们可以在多个计算机(主机)上运行单个容器吗？
我只想知道.. docker中现在有任何可用的工具吗？我已经阅读了Docker中有关多主机功能的一些文档，例如， Docker群 Docker服务(带有副本) 我也知道群模式下的volume问题，容器
docker - 如何将容器文件挂载到我的 Docker 主机？
我想将文件从 Docker 的容器挂载到我的 docker 主机。数据卷不是我的解决方案，因为它们是从 docker 主机到 docker 容器的装载，我需要相反的方法。谢谢最佳答案当 doc
用于远程IP(主机)的Java RMI
我是新手。我无法正确理解RMI。互联网上有大量教程，但据我所知，它们都是针对本地主机的。服务器和客户端都运行在同一台机器上。我想在任何计算机上运行客户端，并且主机将位于一台计算机上，让我们考虑IP
SSH 主机 key 验证仅在其中一个客户端上失败
我无法从客户端“A”SSH 到服务器“B”(但我可以从同一子网上的许多其他 ssh 客户端而不是“A”——所有都是 *nux 机器) serverA>ssh -v -p 端口用户@serverB Op
function - 主机.json；批量大小的含义
设置batchSize = 1有意义吗？如果我想一次处理一个文件？尝试过batchSize = 1000和batchSize = 1 - 似乎具有相同的效果 { "version": "2.0"
haproxy - 主机/路径/的HAProxy路径
由于我不是天生的编码员，请多多包涵。这是我尝试使用HAproxy来实现的目标，但是经过数小时的检查后，我无法以某种方式使其工作。从 domain.com/alpha domain.com/beta
java - 未知 SMTP 主机
我正在使用 tomcat 运行 Java Web 应用程序，通过电子邮件将生成的报告发送给用户。我可以发送电子邮件，但几个小时后服务器停止发送电子邮件，并出现以下错误。 javax.mail.Mess

首页

博学

6Ren·AI

商城

c++ - 在 CUDA 中将动态分配的二维数组从主机复制到设备