带有 Tesseract 的空字符串

Question

带有 Tesseract 的空字符串

Alb*_*ona 6 python ocr opencv tesseract python-tesseract

我正在尝试从一个大文件中读取不同的裁剪图像，并且我设法读取了其中的大部分图像，但是当我尝试使用 tesseract 读取它们时，其中一些返回空字符串。

代码只是这一行：

pytesseract.image_to_string(cv2.imread("img.png"), lang="eng")

Run Code Online (Sandbox Code Playgroud)

有什么我可以尝试阅读此类图像的方法吗？

提前致谢

编辑：

Answer 1

A K*_*ger 10

在传递图像之前对图像进行阈值处理以pytesseract提高准确性。

import cv2
import numpy as np

# Grayscale image
img = Image.open('num.png').convert('L')
ret,img = cv2.threshold(np.array(img), 125, 255, cv2.THRESH_BINARY)

# Older versions of pytesseract need a pillow image
# Convert back if needed
img = Image.fromarray(img.astype(np.uint8))

print(pytesseract.image_to_string(img))

Run Code Online (Sandbox Code Playgroud)

这个打印出来

5.78 / C02

Run Code Online (Sandbox Code Playgroud)

编辑： 仅对第二张图像进行阈值处理返回11.1。另一个有用的步骤是将页面分割模式设置为“将图像视为单个文本行”。与配置--psm 7。在第二张图像上执行此操作返回11.1 "202 '，引号来自顶部的部分文本。要忽略这些，您还可以通过 config 设置使用白名单搜索哪些字符-c tessedit_char_whitelist=0123456789.%。一切都在一起：

pytesseract.image_to_string(img, config='--psm 7 -c tessedit_char_whitelist=0123456789.%')

Run Code Online (Sandbox Code Playgroud)

这返回11.1 202. 显然 pytesseract 很难处理那个百分比符号，我不确定如何通过图像处理或配置更改来改进它。

归档时间：	7 年，1 月前
查看次数：	6190 次
最近记录：	7 年，1 月前