gpt4 book ai didi

opencl - 如何计算 GPGPU 硬件中的峰值 FLOPS?

转载 作者:行者123 更新时间:2023-12-04 00:40:57 24 4
gpt4 key购买 nike

我想计算图形硬件的理论峰值性能。嗯,其实我想了解一下计算。

以 AMD Radeon HD 6670 为例:AMD Accelerated Parallel Processing Programming Guide (http://developer.amd.com/download/AMD_Accelerated_Parallel_Processing_OpenCL_Programming_Guide.pdf) 在第 6-42 页中间告诉我取流核心数 (96),乘以每个流核心每周期的操作数(让我们取一个单精度加法,即 5),然后乘以核心时钟 (800 MHz)。结果是:

96 * 5 FLOPS * 800MHz = 384,000 MFLOPS = 384 GFLOPS

同一份文件在 D-4 页告诉我,这个特定设备的峰值吞吐量为 768 GFLOPS,是我刚才计算的两倍。维基百科和 AMD 主页的声明相同。

所以我的问题是:我在哪里漏掉了二的因数?

最佳答案

我不确定 AMD 硬件,但我记得 NVIDIA 将 MAD(乘加)操作计为两次触发器。由于 MAD 在一个周期内执行,因此理论性能乘以二。

关于opencl - 如何计算 GPGPU 硬件中的峰值 FLOPS?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18813488/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com