有谁知道C/C++/Objective-C中的任何免费/开源文本识别库?基本上可以扫描图像,并读出所有纯文本.
我想将文本图像分成它的组成字符,也作为图像.例如,使用下面的示例,我最终会得到14张图像.
我只会在一行上使用文字,所以y高度并不重要 - 我需要找到的是每个字母的开头和结尾以及裁剪到那些坐标.这样我也可以避免'i','j'等问题.
我是图像处理的新手,我不知道如何去做.某种形式的边缘检测?有没有办法确定纯色的连续区域?任何帮助都很棒.
试图提高我的Python技能和熟悉一些可用的库,所以我使用的是Python Imaging Library(PIL),但我也看过OpenCV.
示例图片:
