表单识别器（带标签的自定义模型）未获取正确的数据

Question

表单识别器（带标签的自定义模型）未获取正确的数据

Pri*_*iya 5 ocr azure-cognitive-services azure-form-recognizer

目前，我正在使用表单识别器 2.1 版预览版从包含扫描图像的 PDF 文件中提取数据。文本已正确获取，但值与标签的映射未按预期进行。我使用带有标签的自定义模型 Train从文件中提取数据，并使用FOTT 网站来标记数据，这提供了手动标记数据的功能。我已经用手动标记的数据训练了 5 页的模型，但没有给出正确的响应。并且还尝试过没有标签的火车没有给出正确的结果。然而，该模型并未给出准确的结果。某些标签未获取，并且某些标签在结果中具有不完整的值。我已阅读Microsoft Docs中的文档来了解此认知服务。它没有给出预期的正确结果，我不明白这有什么问题。所以，我想知道没有得到正确结果的可能原因是什么。

Answer 1

Net*_*eta 1

训练模型时，您是否使用相同结构的 5 个文档？为了改进模型，您还可以添加一些附加文档，以便您的训练数据代表您尝试从中提取数据的文档。在分析文档时，如果缺少键值对，您可以将该文档添加到训练数据中并训练模型，以便它也可以针对该文档进行改进。

如果您将未命中的文档添加到训练中并训练模型，模型是否会改进并提取数据？请随时联系表单识别器联系我们 <formrecog_contact@microsoft.com> 或支持 (2认同)

归档时间：	4 年，10 月前
查看次数：	732 次
最近记录：	4 年，9 月前