任务是拍摄文档的图像,并利用围绕不同“部分”的直线,以将图像拆分为不同的文档以进行进一步解析。不同“部分”的大小在页面之间是完全可变的(我们正在处理数千个页面)。这是这些图像之一的图像:
文档布局示例:
图像分析/操作对我来说是全新的。到目前为止,我已经尝试使用Scikit图像边缘检测算法来查找“盒子”,并希望使用这些“坐标”来裁剪图像。但是,我尝试过的两种算法(Canny,Hough)在高灵敏度时选择文本行作为“边”,而在低灵敏度时不选择我想要的行。我可以编写一些自定义的低级内容来自己检测这些盒子,但是我必须假定这是一个已解决的问题。
我的方法是否朝着正确的方向前进?谢谢!
opencv image-processing edge-detection scikit-image canny-operator