python - 如何从 gpu 内存地址创建 PyCUDA GPUArray？-6ren

python - 如何从 gpu 内存地址创建 PyCUDA GPUArray？

转载作者：太空宇宙更新时间：2023-11-03 14:43:27

25

4

我正在使用 PyTorch，并希望在 PyCUDA 的帮助下对张量数据进行一些算术运算。我可以通过 t.data_ptr() 获取 cuda 张量 t 的内存地址。我能否以某种方式使用此地址以及我对大小和数据类型的了解来初始化 GPUArray？我希望避免复制数据，但这也是一种替代方法。

最佳答案

事实证明这是可能的。我们需要一个指针来处理数据，这需要一些额外的功能:

class Holder(PointerHolderBase):

    def __init__(self, tensor):
        super().__init__()
        self.tensor = tensor
        self.gpudata = tensor.data_ptr()

    def get_pointer(self):
        return self.tensor.data_ptr()

    def __int__(self):
        return self.__index__()

    # without an __index__ method, arithmetic calls to the GPUArray backed by this pointer fail
    # not sure why, this needs to return some integer, apparently
    def __index__(self):
        return self.gpudata

然后我们可以使用此类来实例化 GPUArray。该代码使用 Reikna 数组，它是一个子类，但也应该与 pycuda 数组一起使用。

def tensor_to_gpuarray(tensor, context=pycuda.autoinit.context):
    '''Convert a :class:`torch.Tensor` to a :class:`pycuda.gpuarray.GPUArray`. The underlying
    storage will be shared, so that modifications to the array will reflect in the tensor object.
    Parameters
    ----------
    tensor  :   torch.Tensor
    Returns
    -------
    pycuda.gpuarray.GPUArray
    Raises
    ------
    ValueError
        If the ``tensor`` does not live on the gpu
    '''
    if not tensor.is_cuda:
        raise ValueError('Cannot convert CPU tensor to GPUArray (call `cuda()` on it)')
    else:
        thread = cuda.cuda_api().Thread(context)
    return reikna.cluda.cuda.Array(thread, tensor.shape, dtype=torch_dtype_to_numpy(tensor.dtype), base_data=Holder(tensor))

我们可以返回此代码。我还没有找到一种不复制数据就可以做到这一点的方法。

def gpuarray_to_tensor(gpuarray, context=pycuda.autoinit.context):
    '''Convert a :class:`pycuda.gpuarray.GPUArray` to a :class:`torch.Tensor`. The underlying
    storage will NOT be shared, since a new copy must be allocated.
    Parameters
    ----------
    gpuarray  :   pycuda.gpuarray.GPUArray
    Returns
    -------
    torch.Tensor
    '''
    shape = gpuarray.shape
    dtype = gpuarray.dtype
    out_dtype = numpy_dtype_to_torch(dtype)
    out = torch.zeros(shape, dtype=out_dtype).cuda()
    gpuarray_copy = tensor_to_gpuarray(out, context=context)
    byte_size = gpuarray.itemsize * gpuarray.size
    pycuda.driver.memcpy_dtod(gpuarray_copy.gpudata, gpuarray.gpudata, byte_size)
    return out

旧答案

from pycuda.gpuarray import GPUArray


def torch_dtype_to_numpy(dtype):
    dtype_name = str(dtype)[6:]     # remove 'torch.'
    return getattr(np, dtype_name)


def tensor_to_gpuarray(tensor):
    if not tensor.is_cuda:
        raise ValueError('Cannot convert CPU tensor to GPUArray (call `cuda()` on it)')
    else:
        array = GPUArray(tensor.shape, dtype=torch_dtype_to_numpy(tensor.dtype),
                         gpudata=tensor.data_ptr())
        return array.copy()

不幸的是，传递一个 int 作为 gpudata 关键字(或 pytorch 论坛中建议的 pycuda.driver.PointerHolderBase 的子类型)似乎在表面上有效，但许多操作因看似无关的错误而失败。复制数组似乎将其转换为可用格式。我认为这与 gpudata 成员应该是一个 pycuda.driver.DeviceAllocation 对象有关，它似乎无法从 Python 实例化。

现在如何从原始数据返回到 Tensor 是另一回事。

关于python - 如何从 gpu 内存地址创建 PyCUDA GPUArray？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51438232/

25

4

0

文章推荐： c# - 了解与 odbc 相关的异步方法

文章推荐： python - python 2.7中Unicode字符串到ASCII的转换

文章推荐： c# - 无法解析 Azure 微服务中的类型的服务

文章推荐： asp.net-mvc - BotDetect CAPTCHA 在 https 中不起作用

dns - 域位于一个 IP 地址，子域位于不同的 IP 地址
目前，我有以下设置: A记录: mydomain.com - aaa.aaa.aaa.aaa subdomain.mydomain.com - aaa.aaa.aaa.aaa NS记录: mydoma
nHibernate 将实体映射到多个不同的父实体(例如，地址 -> 公司、地址 -> 客户端)
有人可以帮助我以最佳方式在流畅的 nHibernate 中映射以下情况吗？ Address 类用于 Client 和 Company。如何在 SQL 中最有效地存储它？映射应该是什么样的？我已经考虑过
C# - 一个 MAC 地址，多个源 IP 地址
我正在尝试编写一个 Windows 应用程序，它将在来自 PC 的以太网链接上生成流量。我想使用 webBrowser 控件不断拉取网页以产生流量。在这种情况下，我希望每个 webBrowser
sockets - 如何确定将使用哪个网络接口(interface)(IP 地址)将数据包发送到特定 IP 地址？
我正在编写一个 SIP 堆栈，我需要在消息中插入一个 IP 地址。该地址必须是用于发送消息的地址。我知道目标 IP 并且需要确定将用于发送消息的 NIC(其地址).... 最佳答案为了扩展 Remy
python - 如何使用 IP 地址 python 获取 MAC 地址
如何使用 IP 地址获取 MAC 地址，但以下代码不起作用 packet = ARP(op=ARP.who_has,psrc="some ip",pdst = ip) response = srp(p
iphone - 获取连接到 LAN 的设备的 IP 地址/MAC 地址
目前我想知道如何实现对本地无线网络(路由器)的获取请求以获取当前连接到当前连接的 LAN 的所有设备.... 所以我做了一些研究，显然“nmap”是一个终端/命令提示符命令，它将连接的设备返回到本地无
objective-c - 获取另一台计算机的 MAC 地址，给定其 IP 地址
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicates: how to find MAC address in MAC OS X programmatically
ios - 是否有可能以某种方式将 IPV6 地址转换为 IPV4 地址，或者始终检索 IPV4 地址？
我们正在为 ipad 开发一个 iOS 应用程序，它使用 bonjour 与其他设备连接，使用 couchbaseListener 与对等数据库进行复制。我们观察到，每当 [nsnetservice
如果使用 AWS 弹性 IP 地址，Cassandra 无法联系种子...仅适用于私有(private) IP 地址
我创建了 3 个实例，其中 3 个弹性 IP 地址指向这些实例。我做了 dsc 的 yum 安装:dsc12.noarch 1.2.13-1 @datastax 并且/etc/cassandra/d
azure - 通过 Python SDK 获取规模集中虚拟机的私有(private) IP 地址(规模集中没有公共(public) IP 地址)
我正在尝试获取规模集中所有虚拟机的私有(private) IP 地址列表(没有一个虚拟机故意拥有任何公共(public) IP 地址)。我找到了如何从 az cli 获取此内容，如下所示: az vm
azure - 通过 Python SDK 获取规模集中虚拟机的私有(private) IP 地址(规模集中没有公共(public) IP 地址)
我正在尝试获取规模集中所有虚拟机的私有(private) IP 地址列表(没有一个虚拟机故意拥有任何公共(public) IP 地址)。我找到了如何从 az cli 获取此内容，如下所示: az vm
c# - IPv4 地址 0.0.0.0 和 IPv6 地址::0 是不能用作目标地址的未指定地址
我正在尝试与该端口上的任何 IP 建立连接。最初，我将其设置为 10.0.0.7，这是我网络上另一台计算机的 IP，因此我可以测试客户端/服务器。但是，我希望它可以与任何计算机一起使用而不必将 IP
MySQL/MariaDB 绑定(bind)地址服务器公共(public)地址或者::或 0.0.0.0？
作为序言，我开发了自己的 CRM(类似于 SalesForce 或 SAP)，其“规模”要小得多，因为它面向服务，而不是销售。我在 Ubuntu 16.04 服务器上使用 MySql 或 MariaD
重载函数的C++地址
在我的项目中，我想做如下事情: static void test0(void) { printf("%s [%d]\n", __func__, __LINE__); } static void
套接字和多个 IP 地址
我的机器上有两个网卡，配置了两个独立的 IP 地址。两个 IP 地址都属于同一个网络。我是否正确地说，当我创建一个特定于这些 IP 地址之一的套接字时？更新: 这是我的情况: 我有一个位于 192.
SQL 数据库设计最佳实践(地址)
当然，我意识到没有一种“正确的方法”来设计 SQL 数据库，但我想就我的特定场景中的优劣获得一些意见。目前，我正在设计一个订单输入模块(带有 SQL Server 2008 的 Windows .N
elasticsearch - Elasticsearch最佳实践(地址)
我们将保存大量地址数据(在我公司的眼中，每个客户大约有150.000至500.000行)。地址数据包含约5列: 名称1 名称2 街(+否) 邮政编码市也许以后再添加一些东西(例如电话，邮件等)
验证码 IP 地址
好的，我们在生产中实现了 Recaptcha。我们收到错误是因为它无法到达使用该服务所需的 IP 地址。我们为 IP 地址打开一个端口以到达 Google。没问题。我们这样做并显式配置该 IP 地址以
使用联系表发送的电子邮件显示管理员 "from"地址，而不是访客电子邮件
此页面使用 Drupals 联系表发送电子邮件:http://www.westlake.school.nz/contact 问题是，学校员工使用 outlook。当他们收到来自 parent 等的电子
ios - 地址/邮政编码为NSString到CLLocation
是否可以将用户输入的邮政编码转换为文本框并将其转换为CLLocation？我正在尝试比较其当前位置与地址或邮政编码之间的距离，如果可以从NSString中创建CLLocation，这将很容易。最佳答

首页

博学

6Ren·AI

商城

python - 如何从 gpu 内存地址创建 PyCUDA GPUArray？

旧答案