- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我对 AMD 波前和 OpenCL 的工作组大小的术语有些困惑。
我发现不同的来源做了不同的陈述。
我的问题是:AMDs GCN 技术的波前大小是多少,根据这个:opencl 上的工作组至少应该有多大才不会浪费占用空间。
我得到的信息this document amd 是,GCN 的波前大小是 16。我一次可以在 CU 上运行 4 个波前,并且每个 cu 最多有 40 个飞行中波前。所以我的意思是,在 opencl 中,工作组的大小应该至少为 16。
但是常见的信息(例如在 this 或 this 中)是波前大小为 64,根据此工作组大小应该至少为 64,如果高于 64 的倍数。这也与我的内核上的测量匹配,即工作组大小为 64 时,我获得最高性能,对于低于 64 的所有内容,它会变得更糟。
非常感谢您的澄清。
最佳答案
你弄错了。阅读 this document再次仔细。 SIMD 单元有 16 个工作项,波前大小为 64 个工作项。以下是重要的引述:
第 3 页:
In GCN, each CU includes 4 separate SIMD units for vector processing. Each of these SIMD units simultaneously executes a single operation across 16 work items, but each can be working on a separate wavefront.
This is essential for wavefront control flow; for example, comparisons will generate a result for each of the 64 work-items in a wavefront.
关于opencl - AMD 波前与工作组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31771004/
例如,当我设置我的数量时会发生什么 工作组为 5120 和 localsize 1 工作组到 2560 和 localsize 2 工作组为 640 和 localsize 4 这如何影响我的工作项目
这是一篇很好的博客文章,解释了如何为 Athena 配置两个工作组。一个用于临时用户,另一个用于自动报告。 https://aws.amazon.com/blogs/big-data/separati
工作组、域、域控、活动目录 工作组 在大型局域网中,可能会有很多台工作电脑。为了方便这些计算机进行管理,从 Windows 9x/NT/2000 开始便引入了工作组这一概念。有了工作
使用 terraform EKS module ,如何使用 GPU 节点? EKS docs建议 GPU 支持是自动的,但有些 guides/tutorials建议用户必须安装 nvidia-devi
我有 2 个模板,是从 AWS::Athena::WorkGroup - AWS CloudFormation 中获取的。文档。 第一个模板athena_create.yaml按预期工作。第二个模板需
我是一名优秀的程序员,十分优秀!