Haar级联的图像尺寸考虑

ang*_*rge 5 opencv image-processing computer-vision haar-wavelet

OpenCV Haar级联分类器似乎使用24x24个面部图像作为其正面训练数据.我有两个问题:

  • 除了大型训练图像需要更多处理这一事实外,选择训练图像大小的考虑因素是什么?
  • 对于非方形图像,有些人选择将一维保持在24px,并根据需要扩展另一维(比如100-200px).这是正确的策略吗?
  • 如何决定训练图像的大小(这是问题1的变体)

bjo*_*jou 7

  • 老实说,我认为有更好的参数可以调整,而不是图像尺寸.即便如此,这也是一个从细到粗的检测问题 - 在更精细的层面上,你获得细节,在更粗糙的层面上,你获得了结构.此外,还有一个权衡:对于24x24检测区域,大约有160,000个可能的矩形(类似哈尔)特征,因此增加或减少也会影响训练/测试的数量(这就是为什么使用增强来选择一个一小部分歧视性特征).

  • 正如你所说,这是因为他的目标是不同的(即笔).我认为将先验纵横比信息引入级联训练是明智的,否则你将会得到具有方形边界框的检测器,因为训练阶段正在拾取更大的背景区域.钢笔.

  • 看我的第一个答案.我认为这主要是经验性的.存在用于特征缩放或构建图像金字塔的技术(例如,参见此工作),这也减轻了高度控制训练目标图像大小的选择的有用性.