小编dir*_*lta的帖子

从圆形边框内提取文本

我正在尝试使用 Python 和 OpenCV 开发一个脚本，以检测扫描的仪器图上的一些突出显示区域，并使用 Tesseract 的 OCR 功能输出文本。我的工作流程是首先检测感兴趣区域的大体附近，然后应用处理步骤去除除文本块（线条、边框、噪声）之外的所有内容。然后将处理后的图像输入 Tesseract 的 OCR 引擎。

此工作流程适用于大约一半的图像，但由于文本接触边框而在其余图像上失败。我将在下面展示一些我的意思的例子：

步骤 1：通过使用 InRange 和荧光笔的颜色范围创建蒙版来查找感兴趣的区域。

第 2 步：绘制感兴趣区域的轮廓，裁剪并保存到文件。

--- 引用的代码从这里开始 ---

步骤 3：阈值图像并应用 Canny 边缘检测

步骤 4：轮廓边缘并使用 cv2.approxPolyDP 将它们过滤成圆形并查看顶点大于 8 的边缘。取第一或第二大轮廓通常对应于内边缘。

第 5 步：使用掩码和按位操作，轮廓内的所有内容都被转换为白色背景图像。膨胀和腐蚀用于对图像进行降噪并创建输入 OCR 引擎的最终图像。

import cv2
import numpy as np 
import pytesseract 
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

d_path = "Test images\\"

img_name = "cropped_12.jpg"

img = cv2.imread(d_path + img_name)  # Reads the image

## Resize image before calculating contour 
height, width = img.shape[:2]
img = …

Run Code Online (Sandbox Code Playgroud)

python ocr opencv tesseract computer-vision

dir*_*lta

lucky-day

5
推荐指数

1
解决办法

2477
查看次数