gpt4 book ai didi

cuda - 每个 CUDA 内核的最大指令数?每个 CUDA 流的最大操作数?

转载 作者:行者123 更新时间:2023-12-04 04:58:21 27 4
gpt4 key购买 nike

对于特定的 CUDA 流,是否有最大数量的 CUDA 操作可能处于待处理状态?我在任何文档中都没有看到过这样的限制。

我也对每个 CUDA 内核的最大指令数的相关数字感兴趣。

最佳答案

每个内核有最大数量的 CUDA PTX 指令:

  • 200万适用于具有 Compute Capability 的 GPU低于 2.0(即在 Fermi 微架构之前)
  • 5.12亿适用于具有 2.0 或更高计算能力的 GPU(例如 Fermi、Kepler、Maxwell 等)

  • 此信息可在 CUDA C Programming Guide 中找到,只需查找“每个内核的最大指令数”。

    至于流,如果在给定流上运行的内核遵守此限制,则没有此类流指令限制。正如@talonmies 指出的那样,流是主机端的操作队列,它们与将代码加载到 GPU 无关。

    关于cuda - 每个 CUDA 内核的最大指令数?每个 CUDA 流的最大操作数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16462154/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com