Pri*_*iya 5 ocr azure-cognitive-services azure-form-recognizer
目前,我正在使用表单识别器 2.1 版预览版从包含扫描图像的 PDF 文件中提取数据。文本已正确获取,但值与标签的映射未按预期进行。我使用带有标签的自定义模型 Train从文件中提取数据,并使用FOTT 网站来标记数据,这提供了手动标记数据的功能。我已经用手动标记的数据训练了 5 页的模型,但没有给出正确的响应。并且还尝试过没有标签的火车没有给出正确的结果。然而,该模型并未给出准确的结果。某些标签未获取,并且某些标签在结果中具有不完整的值。我已阅读Microsoft Docs中的文档来了解此认知服务。它没有给出预期的正确结果,我不明白这有什么问题。所以,我想知道没有得到正确结果的可能原因是什么。
训练模型时,您是否使用相同结构的 5 个文档?为了改进模型,您还可以添加一些附加文档,以便您的训练数据代表您尝试从中提取数据的文档。在分析文档时,如果缺少键值对,您可以将该文档添加到训练数据中并训练模型,以便它也可以针对该文档进行改进。