gpt4 book ai didi

cuda - 什么更好——有更多的 block 或线程?

转载 作者:行者123 更新时间:2023-12-04 13:50:25 25 4
gpt4 key购买 nike

更好 = 更快。

我一般会问,但请考虑一种情况,当我的“ worker ”比数据更多时——它比每个块的最后一个线程更好,还是不使用每个网格的最后一个块更好?

最佳答案

您应该记住这个事实,即每个 8 块都在一个 SM(流式多处理器)上运行。您可以将它们视为 CPU 内核。每个块目前最多可以运行1024个线程,与逻辑核心相当,例如当前intel i系列的核心,无论您是否使用所有这些线程,其余的都将被浪费,因为您没有使用他们,其他人也做不到。因此,例如,如果您的 GPU 上有 8 个 SM,您可以分配 64 个块,但您不能为每个块分配 1024 个线程,因为每个 SM 的线程总数有限制,例如 2048。(编辑这些根据集线器提供的信息)

关于cuda - 什么更好——有更多的 block 或线程?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14799959/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com