YOLO物体检测模型?

Kam*_*OUB 1 object-detection deep-learning tensorflow yolo

目前,我正在阅读Yolo9000模型" https://arxiv.org/pdf/1612.08242.pdf ",我对模型如何预测对象检测的边界框非常困惑,我用Tensorflow做了很多例子,并在其中大多数我们给模型"图像和图像标签".

我的问题是:1-我们如何将边界框而不是标签传递给模型?2-模型如何知道许多盒子属于一个图像?

小智 8

在YOLO中,我们将图像划分为7X7网格.对于每个网格位置,网络预测三件事 -

  1. 对象存在于该网格中的概率
  2. 如果对象位于此网格中,那么边界框的坐标是什么?
  3. 如果一个对象位于此网格中,它属于哪个类?

如果我们对所有49个网格位置的所有上述变量应用回归,我们将能够确定哪些网格位置具有对象(使用第一个参数).对于具有对象的网格位置,我们可以使用第二个和第三个参数告诉边界框坐标和正确的类.

一旦我们设计了一个可以输出所需信息的网络,就可以用这种格式准备训练数据,即为数据集中每个图像中的每个7X7网格位置找到这些参数.接下来,您只需训练深度神经网络以回归这些参数.