小编Bar*_*ron的帖子

将附近的边界框合并为一个

我是 python 新手，正在使用快速入门：使用计算机视觉中的 REST API 和 Python 提取打印文本 (OCR)，用于销售传单中的文本检测。因此，给出的该算法具有坐标 Ymin、XMax、Ymin 和 Xmax 和为每行文本绘制一个边界框，如下图所示。

但我想将附近的文本分组为单个分隔框架。因此，对于上图的情况，它将有 2 个包含最接近文本的边界框。

下面的代码提供坐标 Ymin、XMax、Ymin 和 Xmax，并为每行文本绘制边界框。

import requests
# If you are using a Jupyter notebook, uncomment the following line.
%matplotlib inline
import matplotlib.pyplot as plt
from matplotlib.patches import Rectangle
from PIL import Image
from io import BytesIO

# Replace <Subscription Key> with your valid subscription key.
subscription_key = "f244aa59ad4f4c05be907b4e78b7c6da"
assert subscription_key

vision_base_url = "https://westcentralus.api.cognitive.microsoft.com/vision/v2.0/"

ocr_url = vision_base_url + "ocr"

# Set image_url to the URL …

Run Code Online (Sandbox Code Playgroud)

python machine-learning computer-vision python-3.x deep-learning

Bar*_*ron

2019 04-09

8
推荐指数

2
解决办法

2万
查看次数