小编nis*_*neo的帖子

从文档图像中分割线条,单词和字符

我正在开展一个项目,我必须从图像中读取文档.在初始阶段,我将阅读机器打印的文档,然后最终转移到手写文档的图像.但是我这样做是为了学习目的,所以我不打算像Tesseract那样使用apis.我打算按步骤做:

  1. 预处理(模糊,阈值处理,侵蚀和膨胀)

  2. 字符分割

  3. OCR(或后期的ICR)

所以我现在正在进行字符分割,最近我通过水平和垂直直方图进行了分析.对于某些字体,我无法获得非常好的结果,例如显示的图像我无法获得好的结果.

文件的图像

还有其他方法或算法可以做同样的事情吗?任何帮助将不胜感激!

编辑1:

使用cv2.SimpleBlobDetector检测blob后得到的结果. 结果

使用cv2.findContours后得到的结果. 在此输入图像描述

python ocr opencv image-processing

4
推荐指数
1
解决办法
4635
查看次数

标签 统计

image-processing ×1

ocr ×1

opencv ×1

python ×1