我正在尝试在Nvidia卡上找到本机算术运算的吞吐量。在此页面上,Nvidia已记录了各种算术运算的吞吐量值。问题是如何确定我的卡是否进行16位或32位或64位操作,因为每个值都不相同?此外,我还想为我的卡计算这些指令的延迟值。有什么办法吗?就我的研究而言,它们没有像吞吐量那样得到记录。为此有一些基准套件吗?
谢谢!
c++ cuda latency nvidia
c++ ×1
cuda ×1
latency ×1
nvidia ×1