gpt4 book ai didi

c++ - Cuda:从 n 中同步一个核函数

转载 作者:行者123 更新时间:2023-11-28 05:54:17 27 4
gpt4 key购买 nike

我想知道这个问题:有没有办法只同步一个内核函数?例如,如果我有这样的东西:

function_1 <<< dimgrid, dimblock >>> (param1, param2, param3);
funckion_2 <<< dimgrid, dimblock >>> (param4, param5, param5);
function_1 <<< dimgrid, dimblock >>> (param6, param7, param8);

是否有可能知道第二个 function_1 是否在第一个之前完成? cudaDeviceSynchronize() 函数可以帮助我解决这个问题吗?我需要这个,因为我必须为其他内核函数重用一些资源 (param-i)。

最佳答案

如果将每个内核启动到其自己的流中,则可以使用 cudaStreamSynchronize在运行您要等待的内核的流上。所以像这样:

//stream creation for stream1, stream2
...
function_1 <<< dimgrid, dimblock, 0, stream1 >>> (param1, param2, param3);
funckion_2 <<< dimgrid, dimblock, 0, stream2 >>> (param4, param5, param5);
function_1 <<< dimgrid, dimblock, 0, stream1 >>> (param6, param7, param8);

cudaStreamSynchronize(stream1);

可能会做你想做的事。

关于c++ - Cuda:从 n 中同步一个核函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34558487/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com