小编Mar*_*nch的帖子

Google Cloud Vision OCR API返回的边界框/顶点值不正确

我正在使用Google Cloud Vision API的“ TEXT_DETECTION”选项对某些图像进行OCR。

单个字符周围的边界框有时准确,有时不准确,通常在同一图像内。

这是视觉算法的概率性质的正常副作用,视觉API中的错误,还是我解释响应方式的问题?

带有Google Vision OCR API的文本和边框的图像

带有较差边框的字母“ a”

这是特定于字母“ a”的响应部分,我将从中提取边界框。

stdClass Object
(
    [property] => stdClass Object
        (
            [detectedLanguages] => Array
                (
                    [0] => stdClass Object
                        (
                            [languageCode] => en
                        )

                )

        )

    [boundingBox] => stdClass Object
        (
            [vertices] => Array
                (
                    [0] => stdClass Object
                        (
                            [x] => 419
                            [y] => 304
                        )

                    [1] => stdClass Object
                        (
                            [x] => 479
                            [y] => 304
                        )

                    [2] => stdClass Object
                        (
                            [x] => 479
                            [y] => 397
                        )

                    [3] => stdClass …
Run Code Online (Sandbox Code Playgroud)

api bounding-box vertices google-cloud-vision

5
推荐指数
0
解决办法
718
查看次数

标签 统计

api ×1

bounding-box ×1

google-cloud-vision ×1

vertices ×1