我有训练数据,这是jpeg图像的目录和包含文件名和相关类别标签的相应文本文件.我正在尝试将此训练数据转换为tfrecords文件,如tensorflow文档中所述.我花了很多时间试图让它工作但是tensorflow中没有示例演示如何使用任何读者读取jpeg文件并使用tfrecordwriter将它们添加到tfrecord
我是Tensorflow的新手,我正在尝试构建能够对我的图像执行OCR的模型.我必须阅读9个字符(固定在所有图像中),数字和字母.我的模型与此类似
https://matthewearl.github.io/2016/05/06/cnn-anpr/
我的问题是,我是否应该首先针对每个角色训练我的模型,然后在组合角色后获得完整的标签.或者我应该直接在全标签上训练?
我知道我需要传递给模型,图像+相应图像的标签,这些标签的格式是什么,是文本文件,我对该部分有点困惑,所以对传递给模型的标签格式有任何解释会有帮助吗?谢谢,谢谢.
我是 Tensorflow 的初学者,我想用 Tensorflow 构建一个 OCR 模型,从草书阿拉伯字体(即阿拉伯联合手写体)中检测阿拉伯单词。理想情况下,该模型能够检测阿拉伯语和英语。请参阅我当前正在尝试 OCR 的词典中页面的附图。书中的其他页面具有相同的英语和阿拉伯语字体和布局。
我有两个问题:
(1) 我是否需要使用联合/草书阿拉伯语文本中的单个字符进行训练,或者我是否需要整个单词或单个字符的边界框?
(2) 是否有任何其他可用的 OCR Tensorflow(或 Keras)模型可以处理草书书写,特别是阿拉伯语。