相关疑难解决方法(0)

% contrast enhancement
I_adjust = imadjust(I);

% dilation & erosion
se = strel(ones(3,3));
I_dilate = imdilate(I_adjust, se);
I_final = imerode(I_dilate, se);

% gaussian smoothing
h_mask = fspecial('gaussian');
I_final = imfilter(I_final,h_mask);
figure; imshow(I_final);

BW_canny = edge(I_final,'canny');
figure; imshow(BW_canny);

Run Code Online (Sandbox Code Playgroud)

问题#2:

根据belisarius的建议,我发现均值平移滤波器对于文本区域分割非常有效.现在我在执行Stroke Width变换时遇到了另一个问题(参见Epshtein的论文).

即使对于'S',笔划宽度也适用于像'H''Y'这样的字符,因为如果我们沿着渐变方向前进,相应的边缘通常是恒定的距离.

问题来自像'W'这样的字符.对于第一次上行程的左边缘的一部分,我们得到第二个上行的右边缘作为其对应的边缘.而另一部分,我们获得第一次上冲的右边缘.这引入了'W'区域的笔划宽度的显着变化,导致根据纸张将其称为非文本区域.

有谁能建议任何解决方案？

ocr image-processing image-segmentation

Kau*_*rya

2017 05-23

12
推荐指数

1
解决办法

4868
查看次数

为OCR准备复杂的图像

我想识别信用卡上的数字.更糟糕的是,源图像不能保证高质量.OCR将通过神经网络实现,但这不应该是这里的主题.

当前的问题是图像预处理.由于信用卡可以具有背景和其他复杂图形,因此文本不像扫描文档那样清晰.我用边缘检测(Canny Edge,Sobel)进行了实验,但并没有那么成功.同时计算灰度图像和模糊图像之间的差异(如OCR图像处理中的删除背景颜色所述)不会导致OCRable结果.

我认为大多数方法都失败了,因为特定数字与其背景之间的对比不够强.可能需要将图像分割成块并为每个块找到最佳的预处理解决方案？

您对如何将源转换为可读二进制图像有任何建议吗？边缘检测是要走的路还是我应该坚持基本的颜色阈值？

这是一个灰度阈值方法的示例(我显然对结果不满意):

原始图片:

原始图像

灰度图像:

灰度图像

阈值图像:

阈值图像

感谢任何建议,Valentin

ocr image-processing edge-detection

val*_*tin

2017 05-23

12
推荐指数

2
解决办法

4840
查看次数

如何使用MATLAB使黑板文本更清晰？

如果我希望最终图像在数字类型外观上更清晰,我应该放置什么样的滤镜序列.我的意思是只有两种不同的颜色,一种用于纸板,另一种用于粉笔书写.
黑板图像

ocr matlab image-processing computer-vision image-segmentation

作者

2017 07-30

5
推荐指数

1
解决办法

4929
查看次数

如何识别扫描图像中的文本存在模式并进行裁剪？

扫描文档的智能裁剪

最近我接手了旧书/手稿的保存项目.它们数量巨大,近10,000页.我不得不用便携式扫描仪手动扫描它们,因为它们不能在自动书籍扫描仪中扫描.

当我开始在Photoshop中编辑它们时,真正的问题出现了.请注意,它们都基本上是文档(JPG格式),并且这些文档中绝对没有图像.它们使用不同的语言(Oriya),我相信在不久的将来不会有任何OCR软件可用.(如果有,请告诉我.)

为了使这些图像(文档)看起来干净和优雅,我必须裁剪它们,定位它们,稍微增加对比度,用橡皮擦清洁不必要的斑点,等等.我能够在Photoshop中自动化大多数这些过程,但裁剪是我遇到困难的地方.我无法自动裁剪,因为软件无法在img(doc)的某个区域中重新识别文本或内容的存在; 它只是应用赋予它的值进行裁剪.

我想要一个解决方案来自动化这个裁剪过程.我已经想到了这个想法,我不知道它是否足够实用,据我所知,市场上还没有软件能够做到这一点.

对此的可能解决方案:如果工具可以识别图像中文本的存在(这不是非常关键,因为它们都是普通文档图像,其中没有图像,没有图案只是普通矩形)并且可以裁剪它从每一侧的文本边界向外输出,这样它就可以输出没有任何边距的文档图像.其余的任务可以使用Photoshop自动完成,例如为边距添加空格,使用对比度和颜色进行调整,使其更具可读性等.

这是画廊的专辑链接.我可以发布更多样本图片,如果它有用 - 请告诉我.