c++ - CUDA:在 C++ 中包装设备内存分配-6ren

c++ - CUDA:在 C++ 中包装设备内存分配

转载作者：IT老高更新时间：2023-10-28 22:14:10

25

4

我现在开始使用 CUDA，不得不承认我对 C API 有点失望。我理解选择 C 的原因，但是如果该语言是基于 C++ 的，那么几个方面会简单得多，例如设备内存分配(通过 cudaMalloc)。

我的计划是自己做这个，使用重载的 operator new 和放置 new 和 RAII(两种选择)。我想知道到目前为止是否有任何我没有注意到的警告。代码似乎可以工作，但我仍然想知道潜在的内存泄漏。

RAII代码的用法如下:

CudaArray<float> device_data(SIZE);
// Use `device_data` as if it were a raw pointer.

也许在这种情况下一个类是多余的(特别是因为你仍然必须使用 cudaMemcpy，这个类只封装了 RAII)所以另一种方法是 placement new :

float* device_data = new (cudaDevice) float[SIZE];
// Use `device_data` …
operator delete [](device_data, cudaDevice);

这里，cudaDevice 只是作为一个标签来触发重载。然而，由于在正常放置 new 中这将指示放置，我发现语法奇怪地一致，甚至可能比使用类更可取。

我会很感激各种批评。有人可能知道下一个版本的 CUDA 是否计划在这个方向上做一些事情(据我所知，这将改进其对 C++ 的支持，不管他们的意思是什么)。

所以，我的问题实际上是三方面的:

我的展示位置 new 重载在语义上是否正确？它会泄漏内存吗？
有没有人知道 future CUDA 开发朝着这个大方向发展的信息(让我们面对现实:C++ s*ck 中的 C 接口(interface))？
我怎样才能以一致的方式更进一步(还有其他 API 需要考虑，例如，不仅有设备内存，还有常量内存存储和纹理内存)？

// Singleton tag for CUDA device memory placement.
struct CudaDevice {
    static CudaDevice const& get() { return instance; }
private:
    static CudaDevice const instance;
    CudaDevice() { }
    CudaDevice(CudaDevice const&);
    CudaDevice& operator =(CudaDevice const&);
} const& cudaDevice = CudaDevice::get();

CudaDevice const CudaDevice::instance;

inline void* operator new [](std::size_t nbytes, CudaDevice const&) {
    void* ret;
    cudaMalloc(&ret, nbytes);
    return ret;
}

inline void operator delete [](void* p, CudaDevice const&) throw() {
    cudaFree(p);
}

template <typename T>
class CudaArray {
public:
    explicit
    CudaArray(std::size_t size) : size(size), data(new (cudaDevice) T[size]) { }

    operator T* () { return data; }

    ~CudaArray() {
        operator delete [](data, cudaDevice);
    }

private:
    std::size_t const size;
    T* const data;

    CudaArray(CudaArray const&);
    CudaArray& operator =(CudaArray const&);
};

关于这里使用的单例:是的，我知道它的缺点。但是，这些在这种情况下无关紧要。我在这里只需要一个不可复制的小型标签。其他所有内容(即多线程注意事项、初始化时间)均不适用。

最佳答案

与此同时，还有一些进一步的发展(不是在 CUDA API 方面，但至少在尝试使用类似 STL 的方法来管理 CUDA 数据管理的项目方面)。

最值得注意的是 NVIDIA 研究的一个项目:thrust

关于c++ - CUDA:在 C++ 中包装设备内存分配，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/299761/

25

4

0

文章推荐： python - 如何指定python请求http put body？

文章推荐： android - RecyclerView 中的确认和撤消删除

文章推荐： android - 使用 Dagger 2 注入(inject)服务

文章推荐： python - 在python中将Unicode数据转换为int

python 包装
正在尝试创建一个 python 包。似乎有效，但我收到警告。我的 setup.py 是: #! /usr/bin/env python from distutils.core import setup
haskell - 包装/展开通用量化类型
我导入了一个数据类型 X ，定义为 data X a = X a 在本地，我定义了一个通用量化的数据类型，Y type Y = forall a. X a 现在我需要定义两个函数， toY 和 fro
rust - 包装 AsyncRead
我似乎无法让编译器让我包装 Tokio AsyncRead: use std::io::Result; use core::pin::Pin; use core::task::{Context, Po
python - 一个接一个地调用Python函数，包装？
我有两个函数“a”和“b”。当用户上传文件时，“b”被调用。 “b”重命名文件并返回新文件名。之后应该编辑该文件。像这样: def a(): edits file def b(): r
.net - 包装 IQueryable
我使用 Entity Framework 作为我的 ORM，我的每个类都实现了一个接口(interface)，该接口(interface)基本上表示表结构(每个字段一个只读属性)。这些接口(inter
java - 包装 jframe
有没有办法打开一个程序，通常会打开一个新的jframe，进入一个现有的jframe？这里是解释，我下载了一个java游戏，其中一个是反射游戏，它在一个jframe中打开，框架内有一堆子面板，我想要做
Android 包装 block ？
我想要下面的布局 | AA BBBBBBB | 除非没有足够的空间，在这种情况下 | AA | | BBBBBBB | 在这种情况下，A 是复选框，B 是复选框旁边的 Text
CSS 问题 - 包装
我正在尝试以不同的方式包装我的网站，以便将背景分为 2 部分。灰色部分是主要背景，还有白色部分，它较小并包装主要内容。基本上我想要this看起来像this . 我不太确定如何添加图像来创建阴影效果，
Java - IntBuffer 包装
我正在使用 : 读取整数文件 int len = (int)(new File(file).length()); FileInputStream fis = new FileInputStream(f
JavaFX 包装 : NoClassDefFoundError
我使用 maven 和 OpenJDK 1.8 打包了一个 JavaFX 应用程序我的 pom.xml 中的相关部分: maven-assembly-plugin
.net - 包装 ItemsControls 的内容
我正在使用两个不同的 ItemsControl 来生成一个按钮列表。
macros - 包装 TimerOutputs 宏
我有一个情况，有一个变量会很方便，to , 可以是 TimerOutput或 nothing .我有兴趣提供一个采用与 @timeit 相同参数的宏来自 TimerOutputs(例如 @timeit
css - 包装 DIV 的边距问题
我正在尝试包装一个名为 content 的 div与另一个具有不同背景的 div。但是，当将“margin-top”与 content 一起使用时div，似乎包装 DIV 获得了边距顶部而不是 co
.net - 什么是 dnu 包装？
文档不清楚，它似乎允许包装 dll 和 csproj 以在 Asp.Net Core 5 应用程序中使用。它是否允许您在 .Net Core 5 网站中使用针对 .Net Framework 4.6
nservicebus3 - 包装 NServiceBus.IHandleMessages
我被要求开发一个层，该层将充当通用总线，而不直接引用 NServiceBus。到目前为止，由于支持不引人注目的消息，这并不太难。除了现在，我被要求为 IHandleMessages 提供我们自己的定义
javascript - 包装 getServerSideProps 抛出异常
我正在尝试包装 getServersideProps使用身份验证处理程序函数，但不断收到此错误:TypeError: getServerSideProps is not a function我的包装看
scala - 定制 SBT 包装
我有一个项目，它在特定位置(不是/src/resources)包含资源(模板文件)。我希望在运行 package-bin 时将这些资源打包。我看到了 package-options 和 packag
javascript - 优化 Jade 包装
我正在寻找打印从一系列对象中绘制的 div。我可以通过使用下面的管道语法来实现这一点。 each i, key in faq if (key == 0) |
javascript - 包装 Collection.insert
我在 Meteor.js“main.js - Server”中有这个方法。 Meteor.methods({ messageSent: function (message) { var a
dart - 包装 polymer 元素纸张输入的验证错误
我注意到，如果我的自定义Polymer 1.x元素的宽度比纸张输入元素上的验证错误消息的宽度窄，那么错误将超出自定义元素的右边界。参见下图: 有没有一种机制可以防止溢出，例如在到达自定义元素的边界时自

首页

博学

6Ren·AI

商城

c++ - CUDA:在 C++ 中包装设备内存分配