CUDA中的杂项和线程间通信指令

squ*_*rem 5 profiler cuda nvidia instructions

我一直在玩NVIDIA分析器(nvprof),有两个我不明白的特定指标:

inst_inter_thread_communication
    Number of inter-thread communication instructions executed by non-predicated threads
inst_misc
    Number of miscellaneous instructions executed by non-predicated threads
Run Code Online (Sandbox Code Playgroud)

我只是想知道什么指令是线程间通信指令以及哪些指令属于杂项.

参考:http: //docs.nvidia.com/cuda/profiler-users-guide/#metrics-reference

Gre*_*ith 6

SASS指令分为以下两类:

inst_inter_thread_communication

  • SHFL
  • 投票

inst_misc

  • NOP
  • S2R,B2R,R2B,P2R
  • LEPC
  • CSET [P],PSET [P]
  • MOV
  • SEL
  • PRMT
  • Maxwell Only(BAR,DEPBAR)
  • 有几个不常见的未记录的指令增加了这个类别.

文档CUDA二进制实用程序部分指令集参考包含SASS指令的简要说明.SASS和PTX之间的关系接近1:1,因此您还可以查看PTX ISA手册.