Har*_*oad 9 c++ tesseract machine-learning neural-network
对不起,这可能是一个愚蠢的问题.但我对机器学习和Tessaract OCR相当新.我听说Tessaract OCR可以接受培训.
我需要知道的是Tessaract OCR是否使用神经网络作为其默认训练机制,还是我们必须明确地将其编程以使用神经网络?
对不起,如果我正在以错误的方式思考这个"培训"概念.但我需要确切知道的是Tessaract已经使用NN,或者如果不是我如何使用NN与tessaract OCR来提高识别准确度?
如果可以请一些好的资源/方式来推荐/尝试和开始,这将是一个很大的帮助.
我目前所知道的基本机器学习监督培训概念和在Tessaract OCR中执行基本图像OCR操作.
小智 10
似乎Tessaract默认使用自适应分类器.检查一下这是一个很好的阅读:
https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf
似乎有一个名为"多维数据集模式"的选项,它将切换到使用NN作为学习系统而不是自适应分类器(https://code.google.com/p/tesseract-ocr-extradocs/wiki/Cube) .有关自适应分类器的更多信息:
http://www.cs.indiana.edu/~rawlins/website/adaptivity/information-helper.html
此外,与学习分类系统密切相关:
http://en.wikipedia.org/wiki/Learning_classifier_system
此外,您的"培训"术语非常接近.培训是指如何教授模式识别系统或学习系统对某些输入集应该给出的响应.然后,它在遇到未知数据时使用相似性来对新数据进行分类.机器学习是我认为存在的最酷的领域之一(可能有偏见,但无论如何!)继续学习!你是元学习者:学习如何教机器学习!酷的东西!