Fah*_*raz 8 machine-learning string-matching tensorflow recurrent-neural-network
我最近开始探索回归神经网络.到目前为止,我已经使用Andrej Karpathy的博客在tensorFlow上训练了角色级语言模型.它很棒.
然而,我无法找到任何关于使用RNN进行字符串匹配或关键字定位的研究.对于我的一个项目,我需要对扫描文档进行OCR,然后解析转换后的文本以获取关键数据点.大多数字符串匹配技术都无法包含OCR转换错误,从而导致严重错误.
是否可以根据我收到的转换文本的变化来训练RNN并将其用于查找关键字.
这篇论文可能就是您正在寻找的东西:
[1608.02214] 通过半字符循环神经网络进行 Robsut Wrod Reocginiton
简介:
本文作者演示了一种像Cmabrigde Uinervtisy(剑桥大学)这样的混词识别方法。用正确的开始、结束字符和不包含其位置信息的编码内部字符来训练神经网络,神经网络可以学习识别和纠正它。
正如您所提到的,您可以轻松修改网络结构以适应您自己的需要,即 OCR。
| 归档时间: |
|
| 查看次数: |
2254 次 |
| 最近记录: |