验证码图像的字符分割

jon*_*hkr 4 captcha artificial-intelligence machine-learning image-processing image-segmentation

我正在尝试破解 CAPTCHA 图像,但找不到分割字符的方法。

我有这张图片: 在此处输入图片说明

我应用了一些过滤器和阈值,导致了这张图片:在此处输入图片说明

现在我需要对要在 SVM 或 ANN 等分类器中使用的图像进行分割。

问题是有些字符是相连的,我找不到将它们分开的方法。

更多图片示例:

在此处输入图片说明

在此处输入图片说明

在此处输入图片说明

有没有人有办法分割图像并获取字符?

Hug*_*une 5

在我看来,您的字符具有最大笔画宽度。每当您发现比此宽度宽的黑色像素的水平行时,就表明这里连接了两个字符。

所以

  • 对于每个比单个字符宽的连接的 blob
    • 对于该 blob 的每一行
      • 找到该行中所有长于 MAX_STROKE_WIDTH 的黑色像素的所有不间断水平线
      • 注意这些线中心的 X 坐标
    • 对找到的 X 坐标进行聚类
    • 在每个簇的中心用多于 N 个坐标分割块。
    • (您可以简单地垂直拆分,也可以尝试通过集群中的点拟合一条线)