如何获得设备的GPU架构?

Hai*_*ang 3 cuda

cudaGetDeviceProperties具有获取计算能力的属性(major.minor),但是,我们如何将GPU架构(sm _**)提供给设备的编译?

Rob*_*lla 9

  • sm_10是计算能力1.0设备
  • sm_11是计算能力1.1设备
  • sm_12是计算能力1.2设备
  • sm_13是计算能力1.3设备
  • sm_20是一个计算能力2.0设备
  • sm_21是计算能力2.1设备
  • sm_30是计算能力3.0设备
  • sm_32是计算能力3.2设备
  • sm_35是计算能力3.5设备
  • sm_37是计算能力3.7设备
  • sm_50是计算能力5.0设备
  • sm_52是计算能力5.2设备
  • sm_53是计算能力5.3设备
  • sm_60是计算能力6.0设备
  • sm_61是计算能力6.1设备
  • sm_62是计算能力6.2设备

sm_XY对应于"物理"或"真实"架构

compute_ZW对应于"虚拟"架构

并非所有sm_XY都有相应的compute_XY

例如,没有compute_21(虚拟)架构