gpt4 book ai didi

sdk - 充分利用 CUDA 5 的功能需要哪些卡和计算能力

转载 作者:行者123 更新时间:2023-12-04 15:13:46 24 4
gpt4 key购买 nike

关闭。这个问题是off-topic .它目前不接受答案。












想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。

9年前关闭。




Improve this question




我们刚刚收到了稳定版的 CUDA 5。有一些新的术语,如 Kepler 和使用性能更好的 MPI 的能力,以及同时运行同一张卡和 32 个应用程序的能力。我有点困惑,正在寻找这些问题的答案:

  • 充分利用 CUDA 5 的功能需要哪些卡和计算能力?
  • 新功能是否仅适用于 Kepler 架构,例如 GPUDirect、Dynamic Parallelism、Hyper Q 和 Dynamic Parallelism。
  • 如果我们有 Fermi 架构,那么使用 CUDA 5 的好处是什么?除了在 Linux 和 Eclipse 上使用 NSight 的能力之外,它是否带来了其他好处。我认为最重要的功能是构建库的能力?
  • 从 CUDA 4 升级到 CUDA 5,您是否看到任何性能改进。(我在 Linux 机器上得到了一些加速)

  • 我发现了一些文件,比如
  • http://developer.download.nvidia.com/compute/DevZone/docs/html/C/doc/Kepler_Compatibility_Guide.pdf
  • http://www.nvidia.com/content/PDF/kepler/NVIDIA-Kepler-GK110-Architecture-Whitepaper.pdf
  • http://blog.cuvilib.com/2012/03/28/nvidia-cuda-kepler-vs-fermi-architecture/

  • 然而,一个更好、更简短的描述可能会让我们的头脑更清晰。

    PS:请不要将答案局限于上述问题。我可能会错过一些类似的问题。

    最佳答案

    动态并行需要计算能力 3.5(例如 GK110),因为早期的 GPU 没有线程启动内核或直接将其他 API 调用注入(inject)硬件命令队列所需的硬件。

    Hyper-Q 需要计算能力 3.5。

    SHFL 内在函数需要 CC 3.0 (GK104)

    CUDA 5 中的设备代码链接、NSight EE、nvprof、性能改进和错误修复使 Fermi 和更早的 GPU 受益。

    关于sdk - 充分利用 CUDA 5 的功能需要哪些卡和计算能力,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12968782/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com