gpt4 book ai didi

CUDA 三重括号可选参数

转载 作者:行者123 更新时间:2023-12-04 05:40:34 27 4
gpt4 key购买 nike

我知道可以使用三方括号语法启动内核:

kernel<<<NumOfBlocks, NumOfThreadsPerBlock, A, B>>> (...);

最后两个参数是可选的,但我想知道它们指的是什么。 B 应该指的是内核应该执行的流,但是 A 呢?

最佳答案

这是共享内存量。您可以在共享内存中传递所需的字节数。在内核中你应该使用

extern __shared__ T smem[];

而不是
__shared__ T[CONSTANT];

在内核中获取大小为 A/sizeof(T) 的共享数组。

关于CUDA 三重括号可选参数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11308227/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com