kma*_*o23 7 geometry image-processing computer-vision deep-learning
什么是各向异性缩放?它是如何通过图像处理和计算机视觉实现的?
我知道这是non-uniform scaling
维基百科所说的某种形式,但我仍然没有很好地理解它应用于图像时的实际含义。最近,一些用于对象检测的深度学习架构(如 R-CNN)也使用了它,但在这个主题上没有显示太多亮点。
任何可以清楚地解释这个概念的例子和视觉插图都会非常好。
非均匀缩放只是意味着对每个维度应用不同的比例,使其具有各向异性。相反的是各向同性缩放,其中相同的缩放应用于每个维度。
在 R-CNN 的上下文中,作者做了一个技巧,将可变大小的图像与分类网络一起使用,他们将任何图像调整为固定大小(我相信它是 224x224),并且这与图像的纵横比无关。图片。所以假设你有一个 1280x720 的图像,如果它被调整为 224x244,那么比例是 1280/224 和 720/224,这显然是不一样的,因此是各向异性缩放。
归档时间: |
|
查看次数: |
2438 次 |
最近记录: |