Chi*_*ora 5 ocr tesseract machine-learning
google的tesseract-OCR中使用哪种算法进行识别?是神经网络吗?
本文在tesseract源文章中提供了该技术的深入概述.
值得注意的是:
Blob被组织成文本行,并且针对固定音高或比例文本分析行和区域.
[...]
然后,识别以两遍过程进行.在第一遍中,尝试依次识别每个单词.将满意的每个单词作为训练数据传递给自适应分类器.然后,自适应分类器有机会更准确地识别页面下方的文本.
[...]
找到文本行后,使用二次样条曲线可以更精确地拟合基线.
[...]
通过将斑点分组成具有原始直线基线的合理连续位移的组来拟合基线.通过最小二乘拟合将二次样条拟合到人口最多的分区(假设为基线).
本文没有明确说明它是否使用神经网络,但考虑到内容我会说它很可能,至少部分内容.
有关线路查找的更多信息,请参阅R. Smith,"通过文本行累积的简单高效的偏斜检测算法",Proc.第3届国际 CONF.文献分析与识别(第2卷),IEEE 1995,第1145-1148页.
| 归档时间: |
|
| 查看次数: |
3927 次 |
| 最近记录: |