Microsoft Azure认知服务手写检测边界框参数

Roh*_*lai 4 ocr azure computer-vision microsoft-cognitive

我目前正在使用Microsoft Azure认知服务手写检测API。API为边界框返回一组值:

{
    "boundingBox": [
      2,
      52,
      65,
      46,
      69,
      89,
      7,
      95
    ],
    "text": "dog",
    .
    .
    .
Run Code Online (Sandbox Code Playgroud)

我想了解这8个参数。它们的意义是什么,它们反映了什么?我尽力在Microsoft API 文档中找到有关它们的信息,但没有用。请帮助我理解这些参数的含义或将我链接到可以消除此疑问的某个地方。如果您需要更多信息,也请告诉我。

小智 6

此信息被不必要地隐藏。我终于在他们的edx课程中找到了

在此输入图像描述


Mar*_*ari 5

根据,API返回的X,Y坐标框的四个角。所以:

X左上,Y左上,X右上,Y右上,X右下,Y右下,X左下,Y左下