Zom*_*ies 6 c++ ocr fonts image-recognition
有没有人知道用于拍摄图像并在其上执行图像识别的c ++库,以便它可以根据给定的字体和/或字体高度找到字母?即使是不允许你选择字体的那个也不错(例如:readLetters(Image image).
我最近一直在研究这个问题.你最好的只是Tesseract.如果您需要在OCR之上进行布局分析,而不是使用Ocropus(后者使用Tesseract进行OCR).布局分析是指能够检测图像上文本的位置,并进行线分割,块分割等操作.
我通过Tesseract实验找到了一些非常好的技巧,值得分享.基本上我不得不为图像做很多预处理.
如果你有一个高度自定义的字体并单独使用tesseract,你必须"训练"系统 - 基本上你必须提供一堆训练数据.这在tesseract-ocr网站上有详细记载.实际上,您为字体创建了一种新的"语言",并使用-l参数传递它.
我发现的另一种训练机制是Ocropus使用nueral net(bpnet)训练.它需要大量的输入数据来构建良好的统计模型.
在调用Tesseract/Ocropus方面都是C++.它不会像ReadLines(Image)那么简单,但有一个API可以查看.您也可以通过命令行调用.