最适合R-CNN,快速R-CNN,更快的R-CNN和YOLO之间的对象定位

San*_*lus 6 deep-learning deeplearning4j

R-CNN,快速R-CNN,快速R-CNN和YOLO在以下方面有什么区别:(1)同一图像集的精度(2)给定相同的图像大小,运行时间(3)支持android移植

考虑这三个标准,哪个是最佳对象定位技术?

Abh*_*mar 7

R-CNN是所有提到的算法的爸爸算法,它确实为研究人员提供了在其之上构建更复杂,更好的算法的途径。

R-CNN或基于区域的卷积神经网络

R-CNN包含3个简单步骤:

  • 使用称为“选择性搜索”的算法在输入图像中扫描可能的物体,生成约2000个区域建议
  • 在这些区域提案的每个提案之上运行卷积神经网络(CNN)
  • 取得每个CNN的输出,并将其输入到a)支持向量机(SVM)对区域进行分类,以及b)线性回归以收紧对象的边界框(如果存在这样的对象)。

R-CNN的图形描述

快速R-CNN:

快速R-CNN紧随其后。借助以下几点,快速R-CNN变得更快,更好:

  • 在提议区域之前对图像执行特征提取,因此仅在整个图像上运行一个CNN,而不是在2000个重叠区域中运行2000个CNN
  • 用softmax层替换SVM,从而扩展神经网络进行预测,而不是创建新模型

直观地讲,删除2000个conv图层并进行一次卷积并在其之上制作框是很有意义的。

Fast R-CNN的图形描述

更快的R-CNN:

Fast R-CNN的缺点之一是缓慢的选择性搜索算法,而Faster R-CNN引入了一种称为区域提议网络(RPN)的东西。

这是RPN的工作:

在初始CNN的最后一层,一个3x3滑动窗口在特征图上移动并将其映射到较低维度(例如256-d)。对于每个滑动窗口位置,它会基于k个固定比例的锚点生成多个可能的区域框(默认边界框)

每个区域提案包括:

  • 该区域的“客观”得分,以及
  • 4个代表区域边界框的坐标

换句话说,我们查看最后一个特征图中的每个位置,并考虑以k为中心的k个不同的框:一个高框,一个宽框,一个大框等。对于每个框,我们输出是否我们认为它包含一个对象,以及该框的坐标。这是一个滑动窗口位置的外观:

区域提案网

2k分数表示k个边界框在“对象”上的每一个的softmax概率。请注意,尽管RPN输出边界框坐标,但它并未尝试对任何潜在对象进行分类:其唯一的工作仍然是提出对象区域。如果锚点框的“客观性”分数高于某个阈值,则该框的坐标将作为区域建议而向前传递。

一旦有了我们的区域提议,我们就将它们直接馈入实质上的Fast R-CNN。我们添加了一个池化层,一些完全连接的层,最后是一个softmax分类层和包围盒回归器。从某种意义上说,更快的R-CNN = RPN +快速R-CNN。

更快的R-CNN

YOLO:

YOLO使用单个CNN网络使用边界框对对象进行分类和定位。这是YOLO的体系结构:

YOLO

最后,您将得到一个形状为1470的张量,即7 * 7 * 30,CNN输出的结构将是:

YOLO的CNN输出的结构

1470矢量输出分为三个部分,分别给出概率,置信度和方框坐标。这三个部分的每一个还进一步分为49个小区域,对应于形成原始图像的49个像元的预测。

在后处理步骤中,我们从网络输出1470矢量,以生成概率高于特定阈值的框。


希望您对这些网络有所了解,并回答有关这些网络的性能有何不同的问题:

  • 在同一数据集上:“您可以确保这些网络的性能按提及的顺序进行,其中YOLO是最好的,而R-CNN是最差的”
  • 给定SAME IMAGE SIZE,运行时间:更快的R-CNN实现了更好的速度和最先进的精度。值得注意的是,尽管未来的模型在提高检测速度方面做了很多工作,但很少有模型能够在很大程度上超越Faster R-CNN。更快的R-CNN可能不是最简单或最快的对象检测方法,但它仍然是性能最好的方法之一。但是,研究人员已经将YOLO用于视频分割,而到目前为止,它是视频分割中最好,最快的。

  • 支持android移植:据我所知,Tensorflow有一些android API可以移植到android,但是我不确定这些网络的性能如何,甚至您是否可以移植。再次受到硬件和data_size的影响。您能否提供硬件和尺寸,以便我能够清楚地回答。

由@A_Piro标记的youtube视频也给出了很好的解释。

PS我从Joyce Xu Medium博客借了很多资料。


A. *_*iro 3

如果您对这些算法感兴趣,您应该看看本课,其中介绍了您命名的算法:https://www.youtube.com/watch?v =GxZrEKZfW2o 。

PS:如果我没记错的话还有一个Fast YOLO哈哈!