小编mig*_*ult的帖子

如何检测文档图像上的边缘,并将部分切成单独的图像?

任务是拍摄文档的图像,并利用围绕不同“部分”的直线,以将图像拆分为不同的文档以进行进一步解析。不同“部分”的大小在页面之间是完全可变的(我们正在处理数千个页面)。这是这些图像之一的图像:

文档布局示例:

范例文件

图像分析/操作对我来说是全新的。到目前为止,我已经尝试使用Scikit图像边缘检测算法来查找“盒子”,并希望使用这些“坐标”来裁剪图像。但是,我尝试过的两种算法(Canny,Hough)在高灵敏度时选择文本行作为“边”,而在低灵敏度时不选择我想要的行。我可以编写一些自定义的低级内容来自己检测这些盒子,但是我必须假定这是一个已解决的问题。

我的方法是否朝着正确的方向前进?谢谢!

opencv image-processing edge-detection scikit-image canny-operator

5
推荐指数
1
解决办法
510
查看次数