gpt4 book ai didi

cudaMemcpy 和阻塞

转载 作者:行者123 更新时间:2023-12-04 17:24:55 25 4
gpt4 key购买 nike

我对我看到的关于阻塞和 cudaMemcpy 的一些评论感到困惑。我的理解是 Fermi HW 可以同时执行内核和执行 cudaMemcpy。

我读到 Lib func cudaMemcpy() 是一个阻塞函数。这是否意味着 func 将阻止进一步执行,直到副本完全完成?或者这是否意味着在先前的内核完成之前不会开始复制?

例如这段代码是否提供相同的阻塞操作?

SomeCudaCall<<<25,34>>>(someData);
cudaThreadSynchronize();

对比
SomeCudaCall<<<25,34>>>(someParam);
cudaMemcpy(toHere, fromHere, sizeof(int), cudaMemcpyHostToDevice);

最佳答案

你的例子是等效的。如果你想要异步执行,你可以使用流或上下文和 cudaMemcpyAsync ,以便您可以将执行与复制重叠。

关于cudaMemcpy 和阻塞,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11619247/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com