gpt4 book ai didi

cuda - 点对点 CUDA 传输

转载 作者:行者123 更新时间:2023-12-04 23:23:37 28 4
gpt4 key购买 nike

我听说过点对点内存传输并阅读了一些关于它的内容,但无法真正理解与标准 PCI-E 总线传输相比它的速度有多快。

我有一个使用多个 GPU 的 CUDA 应用程序,我可能对 P2P 传输感兴趣。我的问题是:它与 PCI-E 相比有多快?我可以经常使用它让两个设备相互通信吗?

最佳答案

CUDA“对等体”指的是另一个能够从当前 GPU 访问数据的 GPU。所有具有计算 2.0 及更高版本的 GPU 都启用了此功能。

点对点内存复制涉及使用 cudaMemcpy通过 PCI-E 复制内存,如下所示。

cudaMemcpy(dst, src, bytes, cudaMemcpyDeviceToDevice);

请注意 dstsrc可以在不同的设备上。

cudaDeviceEnablePeerAccess 使用户能够启动使用来自多个设备的数据的内核。内存访问仍然通过 PCI-E 完成,并将具有相同的瓶颈。

一个很好的例子是 simplep2p来自 cuda 样本。

关于cuda - 点对点 CUDA 传输,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17707423/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com