Slo*_*rks 17
SESHAT是一个用C++编写的开源系统,用于识别手写的数学表达式.SESHAT是在UniversitatPolitècnicadeValència的PRHLT研究中心开设的博士论文的一部分.
在线演示:http://cat.prhlt.upv.es/mer/
来源:https://github.com/falvaro/seshat
Seshat是一个用于识别手写数学表达式的开源系统.给定一个表示为笔画序列的样本,解析器能够将其转换为LaTeX或其他格式,如InkML或MathML.
根据Metaoptimize的答案以及对Tesseract邮件列表的讨论,似乎没有一个开放/免费的解决方案可以做到这一点.
似乎能够做到这一点的唯一解决方案(但我无法验证,因为它只是Windows和非免费),就像其他人提到的那样,是InftyProject.
小智 6
InftyReader是我唯一知道的.它不是免费软件(似乎资金流向非营利组织,IIRC).
http://www.sciaccess.net/en/InftyReader/
我不知道为什么PDF不能在LaTeX中拥有元数据?如:将LaTeX方程式放入其中!这太难了吗?(我不知道任何有关PDF语法的内容,但我想它可以完成).
LaTeX语法是数学符号的唯一标准.制作MathML和其他东西的人们并没有考虑到这一点,这似乎是非常愚蠢的.InftyReader生成MathML或LaTeX语法.
如果我想要HTML(纯),那么我使用TTH来读取LaTeX语法.只是工作.
ABBYY FineReader(一个伟大的OCR程序)声称你可以训练数学软件,但这是一个极大的脑死亡(谁有时间?)
Unicode有很多数学符号.今天的OCR读者无法理解它们显示了这项活动中令人遗憾的软件状态和大脑缺陷.
对于"一次一个符号",TeX显然有关于它将放置符号的位置的规则.他们不能编写知道这些规则的软件?!TeX甚至是公共领域!他们可以在他们的商业产品中"使用它".