gpt4 book ai didi

performance - 如何获得 Intel Xeon E5-2690 GFlop/s 的峰值性能?

转载 作者:行者123 更新时间:2023-12-04 11:53:49 25 4
gpt4 key购买 nike

我能够在此 Processor Comparison 中找到至强 E5-2690 的理论 DP 峰值性能 371 GFlop/s (有趣的是,在英特尔的竞争对手中找到此信息比在英特尔支持页面本身更容易)。但是,当我尝试推导出峰值性能时,我的推导不匹配:

  • Xeon E5-2690 每个核心的频率(在 Turbo 模式下)= 3.8Ghz
  • 处理器可以做addmul每个周期的操作所以我们得到:3.8 x 2 = 7.6
  • 鉴于它具有 AVX 支持,它每个周期可以执行 4 次双重操作:7.6 x 4 = 30.4
  • 最后,它有 8 个内核,因此我们得到: 8 x 30.4 = 243.2

  • 因此,Gflop/s 的峰值性能将是 243.2 GFlop/s 而不是 371 GFlop/s?

    最佳答案

    Turbo Mode不用于计算Theoretical Peak Performance ,你必须考虑这样的事情:

    CPU 速度 = 2.9 GHz

    CPU 核心数 = 8

    每个周期的 CPU 指令 = 8(考虑 AVX-256 -> 256 位单元,可以容纳 8 个单精度值)x 2(如您所说的加和乘运算)= 16

    放在一起:

    2.9x8x16 = 371 GFlops/s

    关于performance - 如何获得 Intel Xeon E5-2690 GFlop/s 的峰值性能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19134375/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com