卷积神经网络是否具有图像的定位能力?

Bar*_*çer 6 computer-vision feature-detection neural-network deep-learning

据我所知,CNN依赖于滑动窗口技术,并且只能指示在给定的边界框中是否存在某种模式.真的吗?

没有这些技术的帮助,可以用CNN实现本地化吗?

小智 8

这是图像识别中的一个开放问题.除了滑动窗口之外,现有方法包括预测图像中的对象位置作为CNN输出,预测边界(将像素分类为属于图像边界)等等.参见例如本文和其中的参考文献.

还要注意,对于使用最大池的CNN,可以识别有助于对象识别的特征检测器的位置,并使用它来建议可能的对象位置区域.