pgp*_*628 9 profiling tensorflow
此示例显示如何配置tensorflow程序.我用这个工具来描述我的程序,一个简单的LSTM.结果如下:
/gpu:0/stream:all Compute(pid 5)
/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3)
我的问题 :
a)每行的含义是什么.
b)专门之间有什么区别/gpu:0/stream:all Compute(pid 5) 和/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3).
c)为什么他们的执行时间不同,即0.072ms和0.094ms.
以下是一位工程师的最新消息:
“/gpu:0/stream:*”时间线是 CUDA 内核执行时间的硬件跟踪。
“/gpu:0”行是 TF 软件设备将操作排队到 CUDA 流上(通常花费几乎零时间)
| 归档时间: |
|
| 查看次数: |
1543 次 |
| 最近记录: |