是否可以使用pytesseract从图像的特定部分提取文本

Pre*_*r P 5 python ocr opencv text-extraction python-tesseract

我在图像中有边界框（矩形坐标），并希望在该坐标内提取文本。如何使用 pytesseract 提取该坐标内的文本？

我尝试使用 opencv 将图像部分复制到其他 numpyarray

cropped_image = image[y1:y2][x1:x2]

Run Code Online (Sandbox Code Playgroud)

并尝试了 pytesseract.image_to_string()。但准确度非常差。但是当我尝试将原始图像转换为 pytesseract.image_to_string() 时，它完美地提取了所有内容..

是否有任何功能可以使用 pytesseract 提取图像的特定部分？

考虑到我有包含“在线食品配送系统”的矩形坐标，此图像具有不同的信息部分，如何在 pytessaract 中提取该数据？

请帮助提前致谢

我使用的版本： Tesseract 4.0.0 pytesseract 0.3.0 OpenCv 3.4.3

没有使用 Pytesseract 提取图像特定部分的内置函数，但我们可以使用 OpenCV 提取 ROI 边界框，然后将此 ROI 放入 Pytesseract。我们将图像转换为灰度然后阈值以获得二值图像。假设您有所需的 ROI 坐标，我们使用 Numpy 切片来提取所需的 ROI

从这里我们把它扔进 Pytesseract 以获得我们的结果

ONLINE FOOD DELIVERY SYSTEM

Run Code Online (Sandbox Code Playgroud)

代码

import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

image = cv2.imread('1.jpg', 0)
thresh = 255 - cv2.threshold(image, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

x,y,w,h = 37, 625, 309, 28  
ROI = thresh[y:y+h,x:x+w]
data = pytesseract.image_to_string(ROI, lang='eng',config='--psm 6')
print(data)

cv2.imshow('thresh', thresh)
cv2.imshow('ROI', ROI)
cv2.waitKey()

Run Code Online (Sandbox Code Playgroud)

归档时间：	6 年，2 月前
查看次数：	5447 次
最近记录：	6 年，2 月前

Pandas read_csv low_memory和dtype选项 270

模拟一个类:Mock()或patch()？ 105

在Win7 64位,Python 2.6.4中安装PIL(Python映像库) 64

如何在python中的字符串中获取°字符？ 58

使用Django重定向和HttpResponseRedirect有什么区别？ 53

在Python中以秒和纳秒获取POSIX/Unix时间？ 42

Hessian矩阵的图像 8

opencv中的最小值和最大值 3

使用 iText 提取文本不起作用：编码还是加密文本？ 1

Qt Creator Ubuntu版本奇怪的编译错误 0

在Git存储库中查找并恢复已删除的文件 2716

确定已安装的PowerShell版本 2543

为什么在数组迭代中使用"for ... in"是一个坏主意？ 1761

如何显示PHP错误？ 1646

<meta http-equiv ="X-UA-Compatible"content ="IE = edge">是做什么用的？ 1378

如何获取MySQL用户帐户列表 1320

在jQuery中序列化为JSON 1189

Git:如何在项目提交历史中找到已删除的文件？ 1183

如何使用OpenSSL创建自签名证书 1169

Access-Control-Allow-Origin标头如何工作？ 1050