为什么SIFT描述符是规模不变的?

V Y*_*V Y 4 image-processing image-recognition computer-vision cbir

我的理解:SIFT描述符使用从16x16邻域像素计算的方向梯度的直方图.大图像中的16x16区域可以是非常小的区域,例如猫爪上的一根头发的1/10,当您将目标图像调整为小尺寸时,围绕相同关键点的16x​​16邻域可以是大部分的图像,例如猫的爪子使用SIFT描述符将原始图像与调整大小的图像进行比较是没有意义的,任何人都可以告诉我我的理解有什么问题吗?

Pho*_*ton 6

这是一个粗略的描述,但应该让您了解该方法.

SIFT使用的一个阶段是创建图像尺度的金字塔.它将使用低通滤波器缩小和平滑.

然后,特征检测器通过查找不仅在图像空间中具有峰值响应而且在比例空间中也具有峰值响应的特征来工作.这意味着它可以找到特征将产生最高响应的图像比例.

然后,以该比例计算描述符.因此,当您使用较小/较大的版本时,它仍应找到该功能的相同比例.