小编val*_*tin的帖子

为OCR准备复杂的图像

我想识别信用卡上的数字.更糟糕的是,源图像不能保证高质量.OCR将通过神经网络实现,但这不应该是这里的主题.

当前的问题是图像预处理.由于信用卡可以具有背景和其他复杂图形,因此文本不像扫描文档那样清晰.我用边缘检测(Canny Edge,Sobel)进行了实验,但并没有那么成功.同时计算灰度图像和模糊图像之间的差异(如OCR图像处理中的删除背景颜色所述)不会导致OCRable结果.

我认为大多数方法都失败了,因为特定数字与其背景之间的对比不够强.可能需要将图像分割成块并为每个块找到最佳的预处理解决方案?

您对如何将源转换为可读二进制图像有任何建议吗?边缘检测是要走的路还是我应该坚持基本的颜色阈值?

这是一个灰度阈值方法的示例(我显然对结果不满意):

原始图片:

原始图像

灰度图像:

灰度图像

阈值图像:

阈值图像

感谢任何建议,Valentin

ocr image-processing edge-detection

12
推荐指数
2
解决办法
4840
查看次数

标签 统计

edge-detection ×1

image-processing ×1

ocr ×1