gpt4 book ai didi

OpenCl 工作组

转载 作者:行者123 更新时间:2023-12-04 17:37:00 26 4
gpt4 key购买 nike

例如,当我设置我的数量时会发生什么

  • 工作组为 5120 和 localsize 1
  • 工作组到 2560 和 localsize 2
  • 工作组为 640 和 localsize 4

  • 这如何影响我的工作项目数量和对资源的访问?

    最佳答案

  • 您将拥有 5120 threads. 5120 groups. 1 thread per group .每个组(1 个线程)将占用一个处理器。你不能同步它们中的任何一个(传统意义上)。
  • 您将拥有 2560 threads. 1280 groups. 2 threads in each group .每个组(2 个线程)将占用一个处理器。您可以同步这两个线程(传统意义上)。
  • 您将拥有 640 threads. 160 groups. 4 threads in each group .每个组(4 个线程)将占用一个处理器。您可以同步这四个线程(传统意义上)。

  • 在 OpenCL 中,您需要根据线程总数来表示全局工作大小。底层 OpenCL API 将查看全局工作大小并除以本地工作大小以找出您的线程安排。

    现在(这是一个一般性建议。可能在某些情况下您需要这样做,但现在..)
  • 是一个可怕的想法。清楚地。一次给它 1 个线程是在浪费处理器时间。虽然这对于 CPU 来说可能不是世界末日,但对于现代 GPU 来说却是世界末日。为什么?因为 GPU 上的每个处理器都有多个内核。一切准备就绪。在这种情况下,其中只有一个有效。另外,如果需要,您无法同步线程。
  • 一样。
  • 一样。

  • 如果我没记错的话,NVIDIA 建议在一组中至少有 32 个线程以获得最佳性能。

    关于OpenCl 工作组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15312742/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com