c++ - 通过单独的类将数组指针传输到 CUDA 内存中-6ren

c++ - 通过单独的类将数组指针传输到 CUDA 内存中

转载作者：行者123 更新时间：2023-11-28 05:05:17

25

4

我有一个名为“Coordinate”的类，它由一个 int 数组指针和一个 bool 变量组成。我想将这个指针发送到 CUDA，修改它然后在 CPU 内存中使用它。

这是 Coordinate.h :

#ifndef __COORDINATE_H
#define __COORDINATE_H

#include <stdlib.h>
#include <cuda.h>

using namespace std;

class Coordinate {

public:
    int *array_pointer;
    bool flag;

    Coordinate() { flag = false; }

    Coordinate(int array_length) {
        flag = false;
        array_pointer = new int[array_length];
        for (int i = 0; i < array_length; i++) {
            array_pointer[i] = -1;
        }
    }
};

#endif

我在 cudamain.cu Check1 和 Check2 中制作了 2 个global 函数，它们都将坐标作为参数。 Check1 函数将仅更改 bool 标志，而 Check2 将更改 bool 标志并修改数组。

这是 cudamain.cu :

#include <iostream>
#include <cuda.h>
#include "Coordinate.h"

using namespace std;

__global__ void check1(Coordinate *ptr) {
    c->flag = true;
}

__global__ void check2(Coordinate *c) {
    c->flag = true;
    for (int i = 0; i < 10; i++) {
        c->array_pointer[i] = i;
    }
}


int main() {
    Coordinate *d_a, *d_b, a, b;
    a = Coordinate(10); b = Coordinate(10);

    size_t size = sizeof(Coordinate);

    cudaMalloc((void**)&d_a, size); cudaMalloc((void**)&d_b, size);
    cudaMemcpy(d_a, &a, size, cudaMemcpyHostToDevice); cudaMemcpy(d_b, &b, size, cudaMemcpyHostToDevice);

    check1 << <1, 1 >> > (d_a);
    cudaMemcpy(&a, d_a, size, cudaMemcpyDeviceToHost);
    cout <<"d_a result-> " <<a.flag <<" " <<a.array_pointer[9] << endl;

    check2 << <1, 1 >> > (d_b);
    cudaMemcpy(&b, d_b, size, cudaMemcpyDeviceToHost);
    cout << "d_b result-> " << b.flag << " " << b.array_pointer[9] << endl;
    return 0;
}

我制作了 2 个单独的坐标对象 a 和 b，a 将与 check1 一起使用，b 将与 check2 一起使用。 a 和b 都以相同的方式初始化。

我得到的结果是

d_a result-> 1 -1
d_b result-> 0 -1

预期结果:

d_a result-> 1 -1
d_b result-> 1 9

不同的坐标对象可能有不同的数组长度，所以我无法在坐标类中初始化数组指针。

最佳答案

您不能通过取消引用从 CUDA 内核访问主机内存，除非那 block 内存是专门分配来允许这样做的，例如使用 cudaMallocManaged() .所以你的程序无法运行。阅读this Parallel4All post从主机和设备访问相同的内存。另一个alternative是@RobertCrovella 链接到的那个，涉及分配设备端内存。

但是，坦率地说，我怀疑在这种情况下您应该选择这两个选项中的任何一个，因为名为 Coordinate 的类似乎不需要可变大小数组的整数。你确定像

template <unsigned NumDimensions> 
class Coordinate<N> { 
    std::array<int, NumDimensions> a;  
    // etc. etc.
}

不会吗？

(请注意，std::array 类本身不能真正用于设备代码，就像大多数标准库一样。但是您可以轻松地 clone std::array 然后使用您的 cuda::array 类在主机端和设备端。)

即使出于某种原因需要动态分配内存，让一个看起来会被多次使用的类分配自己的内存也不是一个好主意。考虑使用一些预先分配的缓冲区，并让您的 Coordinate 将偏移量提前到其中(尽管这需要同步以确保线程安全，或者使缓冲区成为线程本地的)。

关于c++ - 通过单独的类将数组指针传输到 CUDA 内存中，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44976663/

25

4

0

文章推荐： java - 如何通过JNI将java CharSequence转换为c++ char*

文章推荐： c++ - 将 OpenBLAS 与 Qt Creator 项目链接

文章推荐： javascript - 为什么这个 html 不起作用

文章推荐： css - 用 less 更改折叠导航的背景

c - *指针 = - *指针？
我刚接触 C 语言几周，所以对它还很陌生。我见过这样的事情 * (variable-name) = -* (variable-name) 在讲义中，但它到底会做什么？它会否定所指向的值吗？最佳答案
c - void 指针 = int 指针 = float 指针
我有一个指向内存地址的void 指针。然后，我做 int 指针 = void 指针 float 指针 = void 指针然后，取消引用它们以获取值。 { int x = 25; vo
c++ - 需要将char*(指针)转换为wchar_t*(指针)
我正在与计算机控制的泵进行一些串行端口通信，我用来通信的 createfile 函数需要将 com 端口名称解析为 wchar_t 指针。我也在使用 QT 创建一个表单并获取 com 端口名称作为
C 指针。将大数赋值给 char * 指针
#include "stdio.h" #include "malloc.h" int main() { char*x=(char*)malloc(1024); *(x+2)=3; --
c - int 指针转换为 void 指针，然后转换为 double 指针
#include #include main() { int an_int; void *void_pointer = &an_int; double *double_ptr = void
从 C 中的 3D 指针/数组调用 2D 指针/数组
对于每个时间步长，我都有一个二维矩阵 a[ix][iz]，ix 从 0 到 nx-1 和 iz 从 0 到 nz-1。为了组装所有时间步长的矩阵，我定义了一个长度为 nx*nz*nt 的 3D 指针
c - 释放已分配给 char 指针(字符串)数组的内存。我必须释放每个字符串还是只释放 "main"指针？
我有一个函数，它接受一个指向 char ** 的指针并用字符串填充它(我猜是一个字符串数组)。 *list_of_strings* 在函数内部分配内存。 char * *list_of_strings
c - 使用 malloc 初始化 char 指针 VS 不使用 malloc 直接将字符串赋给 char 指针
我试图了解当涉及到字符和字符串时，内存分配是如何工作的。我知道声明的数组的名称就像指向数组第一个元素的指针，但该数组将驻留在内存的堆栈中。另一方面，当我们想要使用内存堆时，我们使用 malloc，
c# - 通过 P/Ivoke 在 C# 中传递 Struct 指针(主体中带有 char 指针)
我有一个 C 语言的 .DLL 文件。该 DLL 中所有函数所需的主要结构具有以下形式。 typedef struct { char *snsAccessID; char *
指针,C语言的精髓
指针, C语言的精髓莫队先咕几天, 容我先讲完树剖 (因为后面树上的东西好多都要用树剖求 LCA). 什么是指针保存变量地址的变量叫做指针. 这是大概的定义, 但是Defad认为
javascript使递归数组遍历并更新一些内部值(指针)
我得到了以下数组: let arr = [ { children: [ { children: [], current: tru
C程序输出困惑(指针)
#include int main(void) { int i; int *ptr = (int *) malloc(5 * sizeof(int)); for (i=0;
c程序，指针
我正在编写一个程序，它接受一个三位数整数并将其分成两个整数。 224 将变为 220 和 4。 114 将变为 110 和 4。基本上，您可以使用模数来完成。我写了我认为应该工作的东西，编译器一直说
循环中指向int的C++指针？
好吧，我对 C++ 很陌生，我确定这个问题已经在某个地方得到了回答，而且也很简单，但我似乎找不到答案.... 我有一个自定义数组类，我将其用作练习来尝试了解其工作原理，其定义如下: 标题: class
C++ `this` 指针
1) this 指针与其他指针有何不同？据我了解，指针指向堆中的内存。如果有指向它们的指针，这是否意味着对象总是在堆中构造？ 2)我们可以在 move 构造函数或 move 赋值中窃取this指针吗？
C结构，指针
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: C : pointer to struct in the struct definition 在我的初学者类
复制多维数组(指针)
我有两个指向指针的结构指针 typedef struct Square { ... ... }Square; Square **s1; //Representing 2D array of say,
c变量分配内存，指针
变量在内存中是如何定位的？我有这个代码 int w=1; int x=1; int y=1; int z=1; int main(int argc, char** argv) { printf
c编程语言，指针
#include #include main() { char *q[]={"black","white","red"}; printf("%s",*q+3); getch()
指向类成员的模板函数的C++指针
我在“C”类中有以下函数 class C { template void Func1(int x); template void Func2(int x); }; template void

首页

博学

6Ren·AI

商城

c++ - 通过单独的类将数组指针传输到 CUDA 内存中