数周以来,我一直在尝试进行四边形检测和定位,我的目标是有一种强大的方法来获取四边形(矩形)的 4 个点,因此我可以将投影变换应用于图像,然后将其附加到源图像. 我尝试过经典的 opencv 轮廓方法,并且还使用霍夫变换来查找线然后计算交点,这两种方法在将其应用于现实生活图像时是不可用的。

所以我转向 CNN 寻求帮助,但目前我还没有找到任何人尝试使用 CNN 来解决这个简单的问题。
我的第一次尝试是使用最先进的对象检测和定位方法来获得四边形的边界框,以便我可以缩小 4 个点的搜索范围,然后使用图像处理和计算机视觉方法进一步搜索 4 个点。但是尝试了YOLOv2和Faster-RCNN后,预测准确率并不理想。
所以我想知道是否有任何想法我可以使用单个神经网络进行端到端的训练和前馈。它还必须能够合理地处理遮挡。
目前我的想法是移除 fc 层并制作一个与第一个输入层具有相同宽度和高度的巨大激活图(例如 448x448),然后优化 4 个最高激活区域,使用 argmax 来获取位置。但这种方法只适用于一个四边形,它也不适用于角遮挡。
如果有人可以提供任何建议,我将不胜感激。非常感谢!
object-detection computer-vision neural-network deep-learning