Fro*_*bot 3 crop neural-network imagenet
ImageNet图像的大小均不同,但是神经网络需要固定大小的输入。
一种解决方案是采用以图像的中心点为中心的,适合图像大小的裁切大小。这可行,但有一些缺点。通常,图像中感兴趣的对象的重要部分会被切掉,甚至在某些情况下,正确的对象会完全丢失,而另一个属于不同类别的对象可见,这意味着您的模型将被错误地训练为该图像。
另一种解决方案是使用整个图像,并将其零填充到每个图像具有相同尺寸的位置。但是,这似乎会干扰训练过程,并且该模型将学会在图像边缘附近寻找垂直/水平的黑色斑点。
通常做什么?
有几种方法:
您可以看看如何训练最新的ImageNet网络,例如VGG和ResNet。他们通常会详细描述此步骤。