我正在使用Google Cloud Vision API的“ TEXT_DETECTION”选项对某些图像进行OCR。
单个字符周围的边界框有时准确,有时不准确,通常在同一图像内。
这是视觉算法的概率性质的正常副作用,视觉API中的错误,还是我解释响应方式的问题?
这是特定于字母“ a”的响应部分,我将从中提取边界框。
stdClass Object
(
[property] => stdClass Object
(
[detectedLanguages] => Array
(
[0] => stdClass Object
(
[languageCode] => en
)
)
)
[boundingBox] => stdClass Object
(
[vertices] => Array
(
[0] => stdClass Object
(
[x] => 419
[y] => 304
)
[1] => stdClass Object
(
[x] => 479
[y] => 304
)
[2] => stdClass Object
(
[x] => 479
[y] => 397
)
[3] => stdClass …Run Code Online (Sandbox Code Playgroud)