gpt4 book ai didi

performance - CUDA block 大小 1024x1 与 32x32 会有什么性能差异吗?

转载 作者:行者123 更新时间:2023-12-01 02:17:38 24 4
gpt4 key购买 nike

从线程调度和内存带宽的角度来看,这两种块大小(1024x1 与 32x32)的性能如何?这两种块大小的性能是否有任何预期差异?请注意,每个块都使用 1024 个线程。

最佳答案

线程块维度,尤其是当我们谈论每个块的线程数相同时,它们本身不会影响性能。

话题还在 grouped for execution into warps .线程块尺寸的唯一直接影响是更改内置变量,例如threadIdx.x , blockIdx.x等传递给每个线程,这不是性能问题。

关于performance - CUDA block 大小 1024x1 与 32x32 会有什么性能差异吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23619301/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com