gpt4 book ai didi

opencl - AMD 波前与工作组

转载 作者:行者123 更新时间:2023-12-04 18:04:54 37 4
gpt4 key购买 nike

我对 AMD 波前和 OpenCL 的工作组大小的术语有些困惑。
我发现不同的来源做了不同的陈述。

我的问题是:AMDs GCN 技术的波前大小是多少,根据这个:opencl 上的工作组至少应该有多大才不会浪费占用空间。

我得到的信息this document amd 是,GCN 的波前大小是 16。我一次可以在 CU 上运行 4 个波前,并且每个 cu 最多有 40 个飞行中波前。所以我的意思是,在 opencl 中,工作组的大小应该至少为 16。

但是常见的信息(例如在 thisthis 中)是波前大小为 64,根据此工作组大小应该至少为 64,如果高于 64 的倍数。这也与我的内核上的测量匹配,即工作组大小为 64 时,我获得最高性能,对于低于 64 的所有内容,它会变得更糟。

非常感谢您的澄清。

最佳答案

你弄错了。阅读 this document再次仔细。 SIMD 单元有 16 个工作项,波前大小为 64 个工作项。以下是重要的引述:

第 3 页:

In GCN, each CU includes 4 separate SIMD units for vector processing. Each of these SIMD units simultaneously executes a single operation across 16 work items, but each can be working on a separate wavefront.



第 5 页:

This is essential for wavefront control flow; for example, comparisons will generate a result for each of the 64 work-items in a wavefront.

关于opencl - AMD 波前与工作组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31771004/

37 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com