我知道我可以测量一次调用的执行时间sess.run(),但是有可能获得更精细的粒度并测量单个操作的执行时间吗?
此示例显示如何配置tensorflow程序.我用这个工具来描述我的程序,一个简单的LSTM.结果如下:
/gpu:0/stream:all Compute(pid 5)
/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3)
我的问题 :
a)每行的含义是什么.
b)专门之间有什么区别/gpu:0/stream:all Compute(pid 5) 和/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3).
c)为什么他们的执行时间不同,即0.072ms和0.094ms.