c++ - cudaMemcpy 来托管设备分配的内存仍然不可能吗？-6ren

c++ - cudaMemcpy 来托管设备分配的内存仍然不可能吗？

转载作者：行者123 更新时间：2023-11-28 04:07:47

25

4

我有一个带指针的数据结构(想想链表)。在启动读取输入数据的内核之前无法确定其大小。所以我在输入处理期间在设备上分配数据。
但是，尝试将该数据复制回主机失败。据我所知，这是因为 CUDA 中存在限制，不允许运行时 API 访问设备分配的内存。然而，该信息是针对 CUDA 4 的，“即将修复”。有谁知道该修复程序或解决方法是否出现过？我似乎找不到任何关于此的最新信息。

这是一个可重现的例子:

#include <cstdio>

__device__ int *devData;

__global__ void initKernel()
{
    devData = new int[6];
    devData[0] = 0;
    devData[1] = 1;
    devData[2] = 2;
    devData[3] = 3;
    devData[4] = 4;
    devData[5] = 5;
}

__global__ void printKernel()
{
    printf("Testing device: %d\n", devData[3]);
}

int main()
{
    initKernel<<<1,1>>>();
    cudaDeviceSynchronize();

    printKernel<<<1,1>>>();
    cudaDeviceSynchronize();

    int *devAddr;
    cudaGetSymbolAddress((void **)&devAddr, devData);

    int *hostData = new int[6];
    cudaMemcpy(hostData, devAddr, 6*sizeof(int), cudaMemcpyDeviceToHost)); //cudaErrorInvalidValue (invalid argument)
    //same error with: cudaMemcpyFromSymbol(hostData, devData, 6*sizeof(int));

    printf("Testing host: %d\n", testHost[3]);

    return 0;
}

这会为 cudaMemcpy 抛出一个 cudaErrorInvalidValue(与 cudaMemcpyFromSymbol 相同)。当我使用 __device__ int devData[6]; 而不是 __device__ int *devData; 并按预期打印 3 时，这不会引发错误。

最佳答案

还是不行

这记录在 the programming guide 中.

In addition, device malloc() memory cannot be used in any runtime or driver API calls (i.e. cudaMemcpy, cudaMemset, etc).

如果您在内核 malloc() 创建的分配中有数据要传输到主机，则需要先将该数据传输到设备内存分配(或托管分配)，然后复制到主机或在主机代码中使用。

内核内 malloc 的相同注释和用法的所有方面同样适用于内核内 new 以及内核内 cudaMalloc.

关于c++ - cudaMemcpy 来托管设备分配的内存仍然不可能吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58402487/

25

4

0

文章推荐： html - 在鼠标悬停和鼠标单击时更改菜单颜色

.net - IIS 托管 -> 非托管 -> 托管 -> StackOverflowException
我会尝试尽可能详细地描述我的问题，但如果需要更详细的解释，请告诉我。为了简化，假设我有 3 个 DLL(实际上我有更多，但我猜这不是很重要): managed-1.dll - 托管 DLL(用 C#
jsf - CDI 托管 Bean 和 JSF 托管 Bean 可以相互通信吗？
我有一个 Tomcat 6 JSF Web 应用程序，我想使用 CDI bean 来设置它。不过，我必须逐渐将项目转换为 CDI。我的问题是:CDI bean 和传统的 JSF 托管 bean 可以
jsf-2 - 将 JSF 托管 Bean 迁移到 CDI 托管 Bean
我计划将 Web 应用程序从使用 JSF 托管 Bean 转换为使用 CDI 托管 Bean。我知道我需要执行以下操作: 在 WEB-INF 中添加一个空 beans.xml 文件。将所有 JSF
根域上的 https 托管
我在裸域上运行我的解析应用程序。 Parse 并没有让我的生活变得轻松。起初我很难设置它，因为大多数 DNS 托管服务不允许根域上的 CNAME，而 Parse 需要 CNAME。决定尝试使用 C
Firebase 托管 - 函数重写定价
如果您使用 Firebase 托管将请求定向到云函数通过重写，“通过”托管的请求流量是否会记入 Firebase 托管国标转出 ? (忽略 Cloud Function 的计费) 换句话说，
Java Servlet 托管
关闭。这个问题是off-topic .它目前不接受答案。想改善这个问题吗？ Update the question所以它是 on-topic对于堆栈溢出。 9年前关闭。 Improve this q
Firebase 托管 Webhook
我有一个特定的用例，我正尝试使用 Firebase 托管来解决，它如下: 我正在使用 Gridsome 生成静态网站在构建之前，Gridsome 使用 Graphql 并从 Headless CMS
multithreading - 如何在套接字接收事件后更新Blazor(托管)
您好，我有一个blazor页面，我想在其中显示一个变量。这个变量从另一个线程(通过Websocket接收数据的另一个线程)获取更新，我想以线程安全的方式显示它: Blazor页面 @page "/n
Firebase 托管 - 通配符重定向
我想使用 Firebase 托管来托管一个 angular 应用程序，我需要创建一个重定向到另一个 URL 中的一些旧文件。根据 Firebase 文档，您可以进行基本重定向 "redirects"
video - 电子学习网站的视频流(托管)
我正在尝试找出满足电子学习平台以下要求的最佳方法。我在其中编辑视频的后端，以便可以将它们彼此链接(例如youtube-comment函数) 用户只能在访问平台时观看视频(不允许下载!) 视频只能通过
hosting - Streamlit 托管
已关闭。这个问题是 not about programming or software development 。目前不接受答案。这个问题似乎不是关于 a specific programming
directx - 托管 DirectX
我想这是一个相当深入的主题，因此任何带有洞察信息的网址也很乐意接受。我一直在使用原生 DirectX，但从未管理过。另一方面，大多数情况下，在开发不需要高级 GPU 渲染的其他类型的应用程序时，我通常
Firebase 托管 - 密码保护网站？
我刚刚将一个网站部署到 Firebase 托管，效果非常好 - 设置非常简单。但是，我的问题是，有什么方法可以使访问该网站受到身份验证的限制吗？这是一个管理面板，只有我的团队才能访问。有什么方法可以
hosting - Streamlit 托管
已关闭。这个问题是 not about programming or software development 。目前不接受答案。这个问题似乎不是关于 a specific programming
Java+MongoDB 托管
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
apache - 托管 Jenkins
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
java - 托管 javadoc？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找书籍、工具、软件库、教程或其他场外资源的问题对于 Stack Overflow 来说是
Python 3 托管
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 6 年前。
Firebase 托管 - 密码保护网站？
我刚刚将一个网站部署到 Firebase 托管，它运行良好 - 设置非常简单。但是，我的问题是，有什么方法可以通过身份验证限制对网站的访问？这是一个只有我的团队才能访问的管理面板。有什么方法可以用密
使用个人命名空间的 Git 托管
如果我想托管一个对公众用处不大的应用程序(例如，一个将点打印到控制台的程序，它们的数量取决于现在的时间)，我喜欢在启动板中的方式不必乱扔全局托管站点的命名空间并用诸如 HourDot 之类的名称填充它

首页

博学

6Ren·AI

商城

c++ - cudaMemcpy 来托管设备分配的内存仍然不可能吗？