Luv*_*Luv 9 object-detection computer-vision yolo
我不知道锚框和边界框或提案区域之间的区别。我对这些定义感到困惑。而且我不知道检测模型中这些框的含义,因为默认长度永远不会改变!最后,我对 RCNN 系列和 Yolo 系列都输出预测框 location 的事实感到困惑(x,y,w,h)。或输出增量位置(ground truth_x - predicted_x)/prediction_w?
边界框 边界框是由网络预测的框。这些预测框被覆盖在输入图像上,以便您可以直观地了解预测检测到的位置和矩形形状。也就是说,它们是您可以在此 youtube 视频中看到的矩形。
锚框 我们可以对边界框的形状进行一些假设。例如,如果我们想检测人类,我们应该用一些垂直的矩形框搜索人类。它们是锚盒。在训练和预测之前,锚框被馈送到网络,作为一些数字的列表,这是一系列宽度和高度对:
锚点 = [1.08, 1.19, 3.42, 4.41, 6.63, 11.38, 9.42, 5.11, 16.62, 10.52]
上面的这个列表定义了 5 个锚框。我们可以向网络提供任意数量的锚框。
这些值是通过一些统计程序从训练数据中确定的。