gpt4 book ai didi

performance - AVX2 指令延迟和吞吐量

转载 作者:行者123 更新时间:2023-12-04 14:22:14 26 4
gpt4 key购买 nike

我对以下内在函数/指令的性能属性感兴趣:

  • _mm256_andnot_si256/vpandn
  • _mm256_and_si256/vpand
  • _mm256_cmpgt_epi32/vpcmpgtd
  • 和其他一些。

  • 但不幸的是 Intel Intrinsics Guide不包含具有这些内在函数/指令的延迟和吞吐量数字的表。我在哪里可以找到这些信息?

    最佳答案

    延迟和吞吐量数字的三个来源是:

  • InstlatX64
  • Agner Fog's Instruction tables
  • uops.info

  • InSTLatX64 列出了许多不同形式的指令(内存和/或寄存器操作数、不同的操作数宽度等),但没有关于每个执行端口的 μops 数量的信息。对于性能优化,不仅延迟和吞吐量数字很重要,而且每个执行端口的这些 μops 也非常相关。此信息由
    Agner Fog 的指令表和 uops.info 。

    关于performance - AVX2 指令延迟和吞吐量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55537412/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com