数学公式的OCR库

Question

我需要一个开放的OCR库,它能够扫描复杂的打印数学公式(例如通过LaTeX生成的一些公式).我想获得一些类似LaTeX的输出(或者只是一些类似AST的数据).

有没有这样的东西？或者当前的OCR技术是否能够解析面向行的文本？

(请注意,我也在Metaoptimize上发布了这个问题,因为那里的某些人可能还有其他知识.)

这个问题也被OpenAI描述为im2latex.

Answer 1

SESHAT是一个用C++编写的开源系统,用于识别手写的数学表达式.SESHAT是在UniversitatPolitècnicadeValència的PRHLT研究中心开设的博士论文的一部分.

Seshat是一个用于识别手写数学表达式的开源系统.给定一个表示为笔画序列的样本,解析器能够将其转换为LaTeX或其他格式,如InkML或MathML.

Answer 2

根据Metaoptimize的答案以及对Tesseract邮件列表的讨论,似乎没有一个开放/免费的解决方案可以做到这一点.

似乎能够做到这一点的唯一解决方案(但我无法验证,因为它只是Windows和非免费),就像其他人提到的那样,是InftyProject.

InftyProject OCR(现在位于http://www.inftyreader.org/?p=29我相信)并不是那么好:( http://img402.imageshack.us/img402/7875/testinftyproject.png (4认同)

Answer 3

InftyReader是我唯一知道的.它不是免费软件(似乎资金流向非营利组织,IIRC).

我不知道为什么PDF不能在LaTeX中拥有元数据？如:将LaTeX方程式放入其中!这太难了吗？(我不知道任何有关PDF语法的内容,但我想它可以完成).

LaTeX语法是数学符号的唯一标准.制作MathML和其他东西的人们并没有考虑到这一点,这似乎是非常愚蠢的.InftyReader生成MathML或LaTeX语法.

如果我想要HTML(纯),那么我使用TTH来读取LaTeX语法.只是工作.

ABBYY FineReader(一个伟大的OCR程序)声称你可以训练数学软件,但这是一个极大的脑死亡(谁有时间？)

Unicode有很多数学符号.今天的OCR读者无法理解它们显示了这项活动中令人遗憾的软件状态和大脑缺陷.

对于"一次一个符号",TeX显然有关于它将放置符号的位置的规则.他们不能编写知道这些规则的软件？!TeX甚至是公共领域!他们可以在他们的商业产品中"使用它".

Answer 4

查看" Web方程式".它可以将手写方程转换为LaTeX,MathML或SymbolTree.我不确定引擎是否是开源的.