使用递归神经网络进行字符串匹配

Fah*_*raz 8 machine-learning string-matching tensorflow recurrent-neural-network

我最近开始探索回归神经网络.到目前为止,我已经使用Andrej Karpathy的博客在tensorFlow上训练了角色级语言模型.它很棒.

然而,我无法找到任何关于使用RNN进行字符串匹配或关键字定位的研究.对于我的一个项目,我需要对扫描文档进行OCR,然后解析转换后的文本以获取关键数据点.大多数字符串匹配技术都无法包含OCR转换错误,从而导致严重错误.

是否可以根据我收到的转换文本的变化来训练RNN并将其用于查找关键字.

all*_*lee 1

这篇论文可能就是您正在寻找的东西:

[1608.02214] 通过半字符循环神经网络进行 Robsut Wrod Reocginiton

简介:

本文作者演示了一种像Cmabrigde Uinervtisy(剑桥大学)这样的混词识别方法。用正确的开始、结束字符和不包含其位置信息的编码内部字符来训练神经网络,神经网络可以学习识别和纠正它。

正如您所提到的,您可以轻松修改网络结构以适应您自己的需要,即 OCR。


(来源:firefoxusercontent.com


(来源:firefoxusercontent.com