Faster Rcnn Box Coder 中比例因子的用途是什么?

lor*_*arf 2 object-detection deep-learning conv-neural-network tensorflow

我正在使用对象检测 API 并调整 SSD 任务的参数。我的问题是指https://github.com/tensorflow/models/blob/master/research/object_detection/box_coders/faster_rcnn_box_coder.py上的框编码器。为什么将这些比例因子设置为 [10,10,5,5]?原论文没有对此进行解释。我怀疑它必须为位置误差的 4 个分量(tx、ty、tw、th)分配不同的权重,或者解决一些数值稳定性问题,但我想得到确认。谢谢

lor*_*arf 6

我在这里找到答案https://leimao.github.io/blog/Bounding-Box-Encoding-Decoding/,其中变量用作某种带有方差的表示编码。这个问题也是本期的主题https://github.com/rykov8/ssd_keras/issues/53