gpt4 book ai didi

multithreading - 具有OpenCL的GPU线程同步多核CPU线程

转载 作者:行者123 更新时间:2023-12-04 04:37:15 26 4
gpt4 key购买 nike

我一直在使用OpenCL与多核CPU线程进行GPU线程同步。我确实看到了一些CUDA示例,但是,如果有人可以给我一些有关OpenCL的同步方面的提示,我将在这个概念上更加清楚。在此先感谢您的协助。

最佳答案

大卫·埃尔曼(David Ehrmann)是正确的消息来源。我只想添加一些案例:

  • cpu设备中的屏障非常慢,减缓效果甚至超过了cpu和gpu之间的加速比(至少对于中端AMD台式机cpu和低端intel移动cpu)
  • 如果工作组中的所有工作项都没有遇到障碍,则不必再碰壁垒。一个示例可能是在工作组级别的内核中提前退出,其中以棋盘格方式处理(或未处理)图像,从而使交替的工作组进行处理或不进行处理(是的,这效率低下,但是更复杂的工作组选择算法可以这样,在编译时未知某些参数或数据的情况下,这种方法很容易)
  • 原子函数不是障碍。他们只是访问一个更新的(通过其他工作项,原子地)存储单元并对其进行原子地更新。
  • 关于multithreading - 具有OpenCL的GPU线程同步多核CPU线程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40306515/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com