gpt4 book ai didi

.net - .NET 中的 CUDA 全局内存释放问题

转载 作者:行者123 更新时间:2023-12-04 07:03:39 24 4
gpt4 key购买 nike

我有一个类(参见下面的示例),它充当 CUDA 内存结构的 .NET 包装器,
使用 cudaMalloc() 分配并使用 IntPtr 类型的成员字段引用。
(该类使用包含各种 CUDA 功能的 native C DLL 的 DllImport。)

dispose 方法检查指针是否为 IntPtr.Zero,如果不是则调用 cudaFree()
成功释放内存(返回 CUDA 成功)
并将指针设置为 IntPtr.Zero。

finalize 方法调用 dispose 方法。

问题是,如果调用 finalize 方法之前没有调用 dispose,
然后 cudaFree() 函数设置“无效设备指针”的错误代码。

我检查了一下,cudaFree() 接收到的地址与 cudaMalloc() 返回的地址相同,并且之前没有调用 dispose()。

当我添加对 dispose() 的显式调用时,相同的地址被成功释放。

我发现的唯一解决方法是不要从终结器调用 dispose 方法,但是,如果并不总是调用 dispose(),这可能会导致内存泄漏。

任何想法为什么会发生这种情况? - 在 Windows Vista 64 位 + GeForce 8800 和 Windows XP 32 位 + Quadro FX 上的 .NET 3.5 SP1 下,我在 CUDA 2.2 和 2.3 上遇到了同样的问题(不确定是哪个数字)。

类 CudaEntity : IDisposable
{
私有(private) IntPtr 数据指针;

公共(public) CudaEntity()
{
//通过 DllImport 调用 cudaMalloc(),
//接收错误码,如果不为 0 则抛出期望
//给 this.dataPointer 赋值
}

公共(public)处置()
{
if (this.dataPointer != IntPtr.Zero)
{
//通过 DllImport 调用 cudaFree(),
//接收错误码,如果不为 0 则抛出期望

this.dataPointer = IntPtr.Zero;
}
}

~CudaEntity()
{
处置();
}
}

{
//这段代码有效
var myEntity = new CudaEntity();
myEntity.Dispose();
}

{
//此代码导致“无效的设备指针”
//终结器调用 cudaFree() 时出错
var myEntity = new CudaEntity();
}

最佳答案

问题是终结器是在 GC 线程上执行的,在一个线程中分配的 CUDA 资源不能在另一个线程中使用。来自 CUDA 编程指南的片段:

Several host threads can execute device code on the same device, but by design, a host thread can execute device code on only one device. As a consequence, multiple host threads are required to execute device code on multiple devices. Also, any CUDA resources created through the runtime in one host thread cannot be used by the runtime from another host thread.



您最好的选择是使用 using语句,它确保 Dispose()方法总是在“ protected ”代码块的末尾调用:
using(CudaEntity ent = new CudaEntity())
{

}

关于.net - .NET 中的 CUDA 全局内存释放问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1449789/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com