roo*_*ook 12 python image image-processing gdlib
如何在较大的图像中检测图像的位置?我有一个未经修改的图像副本.然后将该图像改变为任意分辨率并随机放置在任意大小的更大图像内.没有对结果图像进行其他变换.Python代码是理想的,它可能需要libgd.如果您知道解决此问题的好方法,您将获得+1.
有一个快速而肮脏的解决方案,只需在目标图像上滑动窗口并计算每个位置的一些相似度,然后选择具有最高相似度的位置.然后将相似度与阈值进行比较,如果得分高于阈值,则得出图像在那里,那就是位置; 如果分数低于阈值,则图像不存在.
作为相似性度量,您可以使用归一化相关或平方差的和(也称为L2范数).正如人们所提到的,这不会涉及规模变化.因此,您还要多次重新缩放原始图像,并使用每个缩放版本重复上述过程.根据输入图像的大小和可能的比例范围,这可能足够好,并且易于实现.
一个合适的解决方案是使用仿射不变量.尝试查找"宽基线立体匹配",人们在那个环境中查看了这个问题.使用的方法通常是这样的:
在此阶段结束时,您将拥有一组描述符.