如何为 Pytesseract 处理这个验证码图像?

Roh*_*alt 0 python ocr python-tesseract

我想用 Pytesseract 自动解决像这样的验证码(所有验证码都是红色背景和白色字母)

验证码图像

我一直在尝试处理图像以使 Pytesseract 能够读取它,但没有成功。很高兴收到您处理此图像的想法。这是我的代码:

import cv2
import pytesseract

tessdata_dir_config = '--tessdata-dir "C:\\Program Files\\Tesseract-OCR\\tessdata"'
pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'

img = cv2.imread("captcha.png")
img = cv2.resize(img, None, fx=2, fy=2)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
adaptive = cv2.adaptiveThreshold(
    gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 85, 20)
print((pytesseract.image_to_string(img, config=tessdata_dir_config)).strip())
print((pytesseract.image_to_string(gray, config=tessdata_dir_config)).strip())
print((pytesseract.image_to_string(adaptive, config=tessdata_dir_config)).strip())

cv2.imshow("Captcha", img) # Output: IMQW
cv2.imshow("Gray", gray) # Output: IMOW
cv2.imshow("Adaptive", adaptive) # Output: IMOW,

cv2.waitKey(7000)
Run Code Online (Sandbox Code Playgroud)

Ahm*_*vli 11

我有一个三步解决方案


    1. 调整大小
    1. 闭幕式
    1. 临界点

第 1 步:调整大小


调整图像大小使 OCR 算法能够检测输入图像中的字符或数字笔画。

步骤 2:结束


闭合是一种形态学操作,旨在去除输入图像中的小孔。

如果我们仔细观察Q,就会发现W字符由很多小孔组成。

步骤 3:阈值


我们将应用简单阈值处理对图像进行二值化。我们的目标是从图像中去除任何残留的伪影。

调整大小 闭幕式 临界点
在此输入图像描述 在此输入图像描述 在此输入图像描述

结果:

IMQW
Run Code Online (Sandbox Code Playgroud)

代码:


IMQW
Run Code Online (Sandbox Code Playgroud)