小编Bar*_*ron的帖子

将附近的边界框合并为一个

我是 python 新手,正在使用快速入门:使用计算机视觉中的 REST API 和 Python 提取打印文本 (OCR),用于销售传单中的文本检测。因此,给出的该算法具有坐标 Ymin、XMax、Ymin 和 Xmax 和为每行文本绘制一个边界框,如下图所示。

在此输入图像描述

但我想将附近的文本分组为单个分隔框架。因此,对于上图的情况,它将有 2 个包含最接近文本的边界框。

下面的代码提供坐标 Ymin、XMax、Ymin 和 Xmax,并为每行文本绘制边界框。

import requests
# If you are using a Jupyter notebook, uncomment the following line.
%matplotlib inline
import matplotlib.pyplot as plt
from matplotlib.patches import Rectangle
from PIL import Image
from io import BytesIO

# Replace <Subscription Key> with your valid subscription key.
subscription_key = "f244aa59ad4f4c05be907b4e78b7c6da"
assert subscription_key

vision_base_url = "https://westcentralus.api.cognitive.microsoft.com/vision/v2.0/"

ocr_url = vision_base_url + "ocr"

# Set image_url to the URL …
Run Code Online (Sandbox Code Playgroud)

python machine-learning computer-vision python-3.x deep-learning

8
推荐指数
2
解决办法
2万
查看次数