Google Cloud Vision API DOCUMENT_TEXT_DETECTION 返回错误的边界框

nam*_*gon 6 ocr google-cloud-vision

我正在使用 Google Cloud Vision API 中的“DOCUMENT_TEXT_DETECTION”选项。

它似乎返回正确的文本值,但坐标边界框不正确。

为什么会出现这个问题呢?

谢谢。

原始图片

在此输入图像描述

绘制边界框图片

在此输入图像描述

返回json


附录

绘制边界框单词和整体

在此输入图像描述

小智 0

DOCUMENT_TEXT_DETECTION 适用于密集文本,我建议对该图像使用TEXT_DETECTION 。

  • 显然,用户使用此谷歌云平台图像作为模拟示例。即使用户提供了密集的文本图像,谷歌视觉边界框在字符级别和单词级别都没有正确对齐。 (3认同)