用于 OCR 阿拉伯语的 Tensorflow 模型

pic*_*olo 6 python mnist deep-learning tensorflow

我是 Tensorflow 的初学者,我想用 Tensorflow 构建一个 OCR 模型,从草书阿拉伯字体(即阿拉伯联合手写体)中检测阿拉伯单词。理想情况下,该模型能够检测阿拉伯语和英语。请参阅我当前正在尝试 OCR 的词典中页面的附图。书中的其他页面具有相同的英语和阿拉伯语字体和布局。

我有两个问题:

(1) 我是否需要使用联合/草书阿拉伯语文本中的单个字符进行训练,或者我是否需要整个单词或单个字符的边界框?

(2) 是否有任何其他可用的 OCR Tensorflow(或 Keras)模型可以处理草书书写,特别是阿拉伯语。

我希望应用 OCR 的阿拉伯语词典扫描页