计算机视觉和机器学习中特征描述符的解释

mar*_*uja 6 machine-learning image-processing feature-extraction computer-vision feature-descriptor

我已经开始大量使用计算机视觉技术,主要是深度学习,但我想尝试很好地理解更传统的技术,并打下良好的基础。我一直在尝试一些手动特征工程技术,用于使用 RF 和 SVM 分类器进行分类。我研究了 HOG 和 LBP 描述符等纹理表示以及边缘滤波器、gabor 滤波器和傅里叶描述符等空间特征。我缺乏的是不同功能如何分组以及它们各自属于什么类别的好主意。我知道有些被定义为全局和本地,但这到底意味着什么以及哪些?我还应该考虑其他类别,例如纹理和几何吗?任何解释都会有用并且非常感激(我在网上查了很多,但这一切似乎都有点支离破碎)

谢谢!

小智 7

特征是从图像中以人类难以理解和关联的数值形式提取的信息。假设我们将图像视为数据,从数据中提取的信息称为特征。一般来说,从图像中提取的特征的维度比原始图像低得多。维度的减少减少了处理图像组的开销。

基本上有两种类型的特征是根据应用从图像中提取的。它们是本地和全球的特征。特征有时被称为描述符。全局描述符通常用于图像检索、对象检测和分类,而局部描述符用于对象识别/识别。检测和识别之间存在很大差异。检测是寻找某物/物体的存在(寻找图像/视频中是否存在物体),而识别是寻找物体的身份(识别人/物体)。

全局特征描述图像作为一个整体来概括整个对象,而局部特征描述对象的图像块(图像中的关键点)。全局特征包括轮廓表示、形状描述符和纹理特征,局部特征表示图像块中的纹理。形状矩阵、不变矩(Hu、Zerinke)、直方图定向梯度(HOG)和 Co-HOG 是全局描述符的一些示例。SIFT、SURF、LBP、BRISK、MSER 和 FREAK 是局部描述符的一些示例。

通常,对于诸如对象检测和分类之类的低级应用,使用全局特征,而对于诸如对象识别之类的高级应用,则使用局部特征。全局和局部特征的组合提高了识别的准确性,但带来了计算开销的副作用。