gpt4 book ai didi

cuda - CUDA 中 shuffle 指令的延迟

转载 作者:行者123 更新时间:2023-12-04 23:23:19 24 4
gpt4 key购买 nike

关于__shfl()的延迟操作说明:

是否有以下指令

c=__shfl(c, indi);

/*
where indi is any integer number(may be random (<32)),
and is different for different LaneID.
*/

与以下相比具有相同的延迟:
c=__shfl_down(c,1);

最佳答案

所有 warp-shuffle 指令都有 same performance .

关于cuda - CUDA 中 shuffle 指令的延迟,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18283335/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com