我一直在尝试使用Python实现一个OCR程序,该程序读取具有特定格式的数字,XXX-XXX.我使用了Google的Cloud Vision API文本识别功能,但结果并不可靠.在30个高对比度1280 x 1024 bmp图像中,只有少数产生正确的输出,或者至少在结果中包含正确的输出.该程序倾向于省略一些数字,以非英语语言输出或隐藏一些特殊字符.
目标是至少连续输出正确的数字,如果结果与其他垃圾混在一起无关紧要.有没有办法帮助程序更好地识别数字,例如将结果限制为特定格式,或仅限于数字?
python ocr text-recognition google-cloud-platform google-cloud-vision