gpt4 book ai didi

cuda - 在 cuda 内核运行时访问 cuda 设备内存

转载 作者:行者123 更新时间:2023-12-04 18:19:19 30 4
gpt4 key购买 nike

我已使用 cudaMalloc 在设备上分配内存并将其传递给内核函数。是否可以在内核完成执行之前从主机访问该内存?

最佳答案

我能想到的在内核仍在执行时启动 memcpy 的唯一方法是在与内核不同的流中提交异步 memcpy。 (如果您将默认 API 用于内核启动或异步 memcpy,NULL 流将强制这两个操作被序列化。)

但是由于无法将内核的执行与流同步,因此该代码将受到竞争条件的影响。即复制引擎可能会从内核尚未写入的内存中提取。

提到映射固定内存的人很喜欢:如果内核写入映射固定内存,它实际上是在完成处理数据时将数据“复制”到主机内存。这个习惯用法很好,只要内核不会再次接触数据。

关于cuda - 在 cuda 内核运行时访问 cuda 设备内存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11005842/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com