如何使用MATLAB分割文本图像？

Question

如何使用MATLAB分割文本图像？

use*_*729 5 ocr matlab pattern-recognition artificial-intelligence machine-learning

它是OCR过程的一部分,它是:

如何将句子分成单词,然后是字符？

这项任务的候选算法是什么？

Answer 1

首先，NIST（美国国家标准与技术研究院）大约 15 年前针对这个确切的问题发布了一个名为NIST 基于表单的手写识别系统的协议，即提取和准备文本图像数据OCR 机器学习算法的输入。NIST 该小组的成员还发表了许多有关该系统的论文。

他们的分类器的性能通过该算法发布的数据（“NIST 手写样本表格”）得到了证明。

我下载并使用的大约六个 OCR 数据集中的每一个都参考了 NIST 使用的数据提取/准备协议来准备输入其算法的数据。特别是，我非常确定这是准备波士顿大学手写数字数据库所依赖的方法，该数据库被视为 OCR 的基准参考数据。

因此，即使 NIST 协议不是真正的标准，至少它是一种经过验证的方法，用于准备文本作为图像以输入 OCR 算法。我建议从那里开始，并使用该协议来准备您的数据，除非您有充分的理由不这样做。

总之，NIST 数据是通过直接从预打印表格中提取 32 位 x 32 位标准化位图来准备的。

这是一个例子：

00000000000001100111100000000000 00000000000111111111111111000000 00000000011111111111111111110000 000000000111111111111111 11110000 00000000011111111101000001100000 00000000011111110000000000000000 00000000111100000000000000000000 00000001111100000 000000000000000 00000001111100011110000000000000 00000001111100011111000000000000 00000001111111111111111000000000 0000000111 1111111111111000000000 00000001111111111111111110000000 00000001111111111111111100000000 00000001111111100011111110000000 000 00001111110000001111110000000 00000001111100000000111110000000 00000001111000000000111110000000 00000000000000000000001111000 000 00000000000000000000001111000000 00000000000000000000011110000000 00000000000000000000011110000000 0000000000000000000011 1110000000 00000000000000000001111100000000 00000000001110000001111100000000 00000000001110000011111100000000 000000000011111 01111111000000000 00000000011111111111100000000000 00000000011111111111000000000000 000000000111111111110000000000000 00000000 001111111000000000000000 00000000000010000000000000000000

我相信 BU 数据准备技术包含了 NIST 技术，但在最后添加了一些步骤，不是为了提高保真度，而是为了减小文件大小。特别是，BU 组：

从 32 x 32 位图开始；然后

将每个 32 x 32 位图划分为不重叠的 4x4 块；

接下来，他们计算了每个块中激活像素的数量（“1”被激活；“0”不是）；

结果是一个 8 x 8 输入矩阵，其中每个元素都是整数 (0-16)

归档时间：	16 年前
查看次数：	5862 次
最近记录：	13 年，3 月前