小编Sac*_*tel的帖子

为什么如此低的预测率25 - 40 [sec/1]使用更快的RCNN在GPU上进行自定义对象检测?

我已经为自定义对象检测训练了一个faster_rcnn_inception_resnet_v2_atrous_coco模型(可在此处获得).

为了预测,我在我的图像上使用了对象检测演示jupyter笔记本文件.还检查了每个步骤消耗的时间,发现它sess.run一直在占用.

但是在GPU上预测(3000 x 2000)像素大小(大约1-2 [MB])的图像需要大约25-40 [秒].

有人能解决这个问题吗?

我已经执行了分析,链接到下载分析文件

链接到完整的分析

系统信息:
培训及预测虚拟机中创建Azure的门户与Standard_NV6(细节在这里它使用),NVIDIA的Tesla M60 GPU

  • 操作系统平台和分发 - Windows 10
  • TensorFlow安装自 - 使用pip pip3 install --upgrade tensorflow-gpu
  • TensorFlow版本 - 1.8.0
  • Python版本 - 3.6.5
  • GPU/CPU - GPU
  • CUDA/cuDNN版本 - CUDA 9/cuDNN 7

machine-learning object-detection deep-learning tensorflow

6
推荐指数
1
解决办法
563
查看次数