在图像文本文档中随机生成合成噪声

Aly*_*ono 6 image machine-learning image-processing random-seed data-augmentation

我正在研究对脏图像文档进行去噪。我想创建一个数据集,其中添加合成噪声来模拟现实世界的混乱伪影。模拟污垢可能包括咖啡渍、褪色的太阳斑、折角的页面、大量皱纹等等。我该怎么做呢?

干净图像示例:

在此输入图像描述

添加合成噪声后:

在此输入图像描述 在此输入图像描述 在此输入图像描述 在此输入图像描述

如何随机获得上面显示的图像?

mrk*_*mrk 3

刮擦 - 背景 - 图像

在我看来,引入现实世界噪声的明显方法是引入现实世界噪声。因此,您可以在网络上抓取纸张背景(示例链接):

  1. 纸张背景
  2. 脏纸背景
  3. 彩色纸背景

应该做到这一点。

根据您需要多少种不同的模式,您可能希望自动抓取网络(selenium和 python 包可以支持您)。

覆盖 - 背景 - 与 - 您的 - 文本

接下来,根据您选择的编程语言,您应该能够使用您想要为 python 和 opencv 增强的文本图像覆盖您的背景图像,这在 SO 上有深入介绍

作为最后一步,您还可以使用增强器包来进一步增强和扩充您的数据。