Google Cloud Vision API DOCUMENT_TEXT_DETECTION 返回错误的边界框

nam*_*gon 6 ocr google-cloud-vision

我正在使用 Google Cloud Vision API 中的“DOCUMENT_TEXT_DETECTION”选项。

它似乎返回正确的文本值，但坐标边界框不正确。

为什么会出现这个问题呢？

谢谢。

原始图片

绘制边界框图片

返回json

附录

绘制边界框单词和整体

DOCUMENT_TEXT_DETECTION 适用于密集文本，我建议对该图像使用TEXT_DETECTION 。

显然，用户使用此谷歌云平台图像作为模拟示例。即使用户提供了密集的文本图像，谷歌视觉边界框在字符级别和单词级别都没有正确对齐。 (3认同)

归档时间：	7 年，5 月前
查看次数：	1638 次
最近记录：	5 年前

超正方体的替代方案 7

OCR(tesseract),图像的智能旋转 6

从node.js中的扫描图像评估复选框 6

CNN上的数字识别 6

Howto:使用C#在OCR之前提高PDF质量 5

在tesseract中找不到Lib错误 5

适用于Android的完美OCR扫描 5

如何将 Amazon Textract 用于 PDF 文件 5

在Tesseract OCR中使用了什么阈值(二值化)算法？ 4

ZXing.net解码抛出IndexOutOfRangeException 1

如果我有jQuery背景,"在AngularJS中思考"？ 4518

正则表达式匹配不包含单词的行？ 4121

为什么Android模拟器这么慢？我们如何加快Android模拟器的速度？ 3356

如何在jQuery中选择具有多个类的元素？ 1985

如何将package.json中的每个依赖项更新为最新版本？ 1871

静态类和单例模式之间的区别？ 1708

在不应用它的情况下查看存储中的内容 1650

命名类 - 如何避免将所有内容称为"<WhatEver> Manager"？ 1147

.gitignore for Visual Studio项目和解决方案 1115

Objective-C中的快捷方式用于连接NSStrings 1114