如何补偿打印页面照片中的不均匀照明?

Nor*_*sey 4 image-processing image-scanner

我正在尝试将我的相机教成扫描仪:我拍摄印刷文本然后将它们转换为位图(然后转换为djvuOCR'ed).我需要计算一个像素应该是白色和哪个黑色的阈值,但是我被不均匀照明阻碍了.例如,如果中心的像素足够暗,我可能会在角落里看到一堆黑色像素.

在相对简单的假设下,我想做的是在阈值处理之前补偿不均匀的照明.更确切地说:

  • 假设一个或两个光源,可能是一个在表面上的光强度逐渐变化(环境光),另一个是反方形(直射光).

  • 假设纸张的白色部分都具有相同的反射率/反照率/等等.

  • 找到一些算法来估计每个像素的照度,并从中恢复每个像素的反射率.

  • 从像素的反射率,将其分类为白色或黑色

我不知道如何编写算法来做到这一点.我不想回到最小二乘拟合,因为我在估算光照时会想要忽略暗像素.我也不知道算法是否有效.

所有有用的建议都将被投票!


编辑:我肯定认为是图像斩波成足够大,所以他们看起来仍然是"白色背景上的文字",但足够小,所以单件的照明被或多或少甚至件.我想如果我然后插入阈值,以便在子图像边界之间没有不连续性,我可能会得到一些不错的东西.这是一个很好的建议,我将不得不给它一个尝试,但它仍然给我留下的在哪里画白色和黑色之间的界限问题.更多想法?


编辑:以下是来自GIMP的一些屏幕转储,显示了不同的直方图和每个直方图的"最佳"阈值(手动选择).在三个中的两个中,整个图像的单个阈值足够好.然而,在第三个中,左上角确实需要不同的阈值:

Har*_*ier 5

我不确定你是否仍然需要一个解决方案,但如果你仍然这样做.几年前,我和我的团队用相机拍摄了大约250,000页,并将它们转换为(几乎是黑白)灰度图像,然后我们将它们视为DjVued(也是制作PDF文件).

(参见法国本地治里学院1144份成绩单的目录和完整的摄影传真集.)

我们还遇到了不均匀照明的问题.我们提出了一个简单的简单解决方案,在实践中非常有效.此解决方案还应该用于创建黑白图像而不是灰度(如我所述).

  1. 相机和照明设置

    a)我们将空白相框粘贴到表格顶部,以使页面保持完全相同的位置.

    b)我们将相机放在桌子顶部的三脚架上,并指向录制的相框,并且在相邻顶部的外部闪光灯支架上的一个宽约一英尺的条上我们连接了两个"造型灯" .这些可以在任何好的相机商店购买.它们旨在提供均匀的照明.通过在每个造型灯周围放置一个小纸板箱,将相机遮挡在灯光下.我们拍摄了灰度,然后我们进一步处理.(我们的页面是用蓝色墨水书写的旧褐色纸,所以你的情况应该更简单).

  2. 处理图像

    我们使用免费软件包irfanview.

    该软件具有批处理模式,可以同时进行色彩校正,改变位深度和裁剪图像.我们将拍摄一页的照片,然后以交互模式调整亮度,对比度和伽玛设置,直到它接近黑白.(我们使用灰度,但是通过将位深度设置为2,当您批量处理所有页面时,您将获得黑白.)在确定最佳颜色校正后,我们交互式地裁剪单个图像并记录裁剪设置.然后,我们在批处理模式窗口中设置所有这些设置,并处理一本书的页面.

  3. 创建DjVu图像.

    我们使用免费的DjVu Solo 3.1来创建DjVu图像.这有几种模式来创建DjVu图像.创建黑白图像的模式对我们的照片效果不佳,但"照片"模式确实如此.

    我们没有OCR(因为图像是手写的梵语),但只要字母均匀照明我认为你的OCR软件应该忽略大的黑色区域,如两页传播.但是你总是可以通过在左页面上裁剪一次页面两次,在右边页面上裁剪一次页面,并且在右边页面上裁剪一次,并且irfanview软件将允许您巧妙地为您的页面编号,从而摆脱两页展开或边缘之间的黑色然后可以按正确的顺序重新合并页面.即将您的页面重命名为左侧页面的page-xxxA和右侧页面的page-xxxB,然后页面将在名称上正确排序.

如果你仍然需要一个解决方案,我希望上面的一些对你有用.

  • 哈利,这看起来很棒.我希望我有这样的奢侈品.不幸的是,我正在寻找的是解决不均匀照明问题的*软件*解决方案.如果我需要创建成千上万的图像,我会像你一样拥有建立良好照明的资源.但我正试图解决另一个问题. (2认同)

小智 1

出色地。通常,我所做的图像处理对时间高度敏感,因此像您正在寻找的复杂算法是行不通的。但 。。。您是否考虑过将图像切成小块,然后重新缩放每个子图像?即使在可变照明条件的图像中,这也应该使“暗”像素相当突出(我假设您正在谈论带有暗文本的标准大部分白色页面。)

这是一种作弊,但比您建议的“正确”方式容易得多。