了解张量流分析结果

pgp*_*628 9 profiling tensorflow

此示例显示如何配置tensorflow程序.我用这个工具来描述我的程序,一个简单的LSTM.结果如下:

/gpu:0/stream:all Compute(pid 5)

MatMul_AllCompute

/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3)

MatMul_GpuCompute

我的问题 :

a)每行的含义是什么.

b)专门之间有什么区别/gpu:0/stream:all Compute(pid 5)/job:localhost/replica:0/task:0/gpu:0 Compute(pid 3).

c)为什么他们的执行时间不同,即0.072ms0.094ms.

Pet*_*den 2

以下是一位工程师的最新消息:

“/gpu:0/stream:*”时间线是 CUDA 内核执行时间的硬件跟踪。

“/gpu:0”行是 TF 软件设备将操作排队到 CUDA 流上(通常花费几乎零时间)