gpt4 book ai didi

cuda - CUDA中的杂项和线程间通信指令

转载 作者:行者123 更新时间:2023-12-04 18:41:17 25 4
gpt4 key购买 nike

我一直在玩 NVIDIA 分析器 (nvprof),有两个我不明白的特定指标:

inst_inter_thread_communication
Number of inter-thread communication instructions executed by non-predicated threads
inst_misc
Number of miscellaneous instructions executed by non-predicated threads

我只是想知道哪些指令是线程间通信指令,哪些指令属于杂项。

引用:
http://docs.nvidia.com/cuda/profiler-users-guide/#metrics-reference

最佳答案

分为两类的 SASS 指令如下:

inst_inter_thread_communication

  • SHFL
  • 投票

  • inst_misc
  • NOP
  • S2R、B2R、R2B、P2R
  • LEPC
  • CSET[P], PSET[P]
  • MOV
  • SEL
  • PRMT
  • 仅麦克斯韦 (BAR, DEPBAR)
  • 有几个不常见的未记录的指令增加了这个类别。

  • 文档 CUDA 二进制实用程序 Instruction Set Reference包含对 SASS 指令的简要说明。 SASS 和 PTX 之间存在接近 1:1 的关系,因此您还可以查看 PTX ISA手动的。

    关于cuda - CUDA中的杂项和线程间通信指令,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25670827/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com