标签: scanning

使用 ImageMagick 修剪外部空白空间不适用于扫描文档

给定一个图像,里面有一些实际的内容,通常有一些不需要的白色或黑色或透明度,我想使用 ImageMagick 修剪或裁剪外部部分。

以下图像是在计算机上以数字方式绘制的(在 HTML 上<canvas>):

画布.png

以下 ImageMagick 命令是我尝试过的:

$ convert canvas.png -trim +repage canvas_trimmed.png
Run Code Online (Sandbox Code Playgroud)

它工作得很好:

canvas_trimmed.png

所以这正是我想要的。但现在我希望它也适用于扫描文档,这些文档不像计算机生成的图像那样“完美”,即它们具有更多的“白色”和“黑色”阴影,并且没有更容易检测的透明度。有时,他们甚至会在纸张的白色背景周围出现一些黑条,因为扫描仪的区域比纸张大:

扫描.jpg

对于这张图片,我按照给定的顺序尝试了以下命令,每个命令都试图更加激进,但没有产生任何结果 - 您看不到原始图像和“修剪”图像之间的任何区别,即修剪或裁剪根本不起作用:

$ convert scan.jpg -trim +repage scan_trimmed.jpg
$ convert scan.jpg -fuzz 10% -trim +repage scan_trimmed.jpg
$ convert scan.jpg -fuzz 60% -trim +repage scan_trimmed.jpg
$ convert scan.jpg -fuzz 60% -bordercolor white -border 1x1 -trim +repage scan_trimmed.jpg
$ convert scan.jpg -fuzz 60% -bordercolor black -border 1x1 -trim +repage scan_trimmed.jpg
Run Code Online (Sandbox Code Playgroud)

我在这里做错了什么?如何修改能够可靠地修剪计算机生成图像的 ImageMagick 命令,使其能够同样可靠地修剪上述样式的扫描文档?

scanner scanning documents imagemagick image-manipulation

5
推荐指数
1
解决办法
3146
查看次数

为什么扫描会占用这么多空间?

如果我想扫描一个文档,10 页,每页为 PDF 300dpi,灰度。10 页 6MB.. 40 页 24MB。美好的。彩色,每页25MB 为什么彩色是25MB?

PDF效率很低吗?它可以处理文本和图像。

但一个更大的问题,

比那更疯狂.. 我将 10 页扫描成一个文档。它在我的 TEMP 文件夹中占用 1GB。一千兆!!!它处理它然后释放 1GB。

但是为什么在处理过程中多达 1GB !对于 6MB 的文档!

我认为它在这里 C:\Documents and Settings\user\Local Settings\Temp\MaglevExpressTemp

软件是 HP 解决方案中心。

其他软件会占用那么多空间吗?有些比其他的差吗?我不应该为我的 HP 扫描仪使用 HP 解决方案中心吗?

windows scanner scanning

3
推荐指数
1
解决办法
5018
查看次数

如何在 10 天内有效扫描 130,000 页纸页

我有一个相当大的项目,最终将造福社会,我正在寻找我能召集的所有帮助。我有大约 130,000 页需要数字化。它们中的许多都装在有订书钉的包装里,或者是用了 40 多年的纸(与今天的纸相比非常薄)。其中一些尺寸奇怪(全尺寸合法,地图和小明信片尺寸......)。但是,我们只有大约 10 天的时间来处理这项工作(一旦我们到达现场)。我们可以通宵工作。  

我有一个 6 人的团队,我们完成这项任务的预算相对较少。我们考虑过现代扫描仪(例如进纸托盘 fujitsu scansnap),它可以以约 25ppm(每分钟页数)的速度处理页面,但我们担心页面被撕裂或卡住(并且我们正在努力不危及原件) . 还有订书钉的问题(可以删除......)。我们可以做平板,但是哇,手动完成这是一项艰巨的工作!对于非常大的零件,我们总是可以这样做。

我希望你们对如何实现这一点有一些非常聪明的想法......非常感谢您的时间和帮助 


编辑似乎组合方法(高级纸扫描仪 + 垂直复印架)效果最好,以确保所需的页数/分钟。一个离线建议:复印机?如果我们先简单地复印整个收藏,然后让复印机继续发送数字,或者在扫描仪中复印复印件,我们会假设会发生什么。对我来说这似乎是双重工作,但我对技术的胆量不够熟悉,无法更好地了解。

scanning ocr archiving paper document-scanning

3
推荐指数
2
解决办法
1681
查看次数

扫描 A4 文档 &gt; pdf &gt; ocr &gt; 翻译成英文?

我试过使用组合

  • 我的家用扫描仪创建“300 dpi”、“文档”、“pdf”(佳能多合一选项)
  • ZoHoViewer 创建 RTF 或 TXT 文件
  • 谷歌文档翻译

我不确定 ZoHoViewer 产品的好坏,但以下几点:

Als Arbeitsmarkbehörde haben wir den gesetzlichen Auftrag, die Vermittelbarkeit von

变成:

AlsArbeitsmarktbeh6rde habenwirdengesetzlichenAuftrag,dieVermittelbarkeit vonSt...

因此,goog docs 使尝试翻译它成为猪的早餐。

有没有人有更好的建议(最好是免费的在线服务)

pdf language translation scanning ocr

2
推荐指数
1
解决办法
3591
查看次数

如何在 Adob​​e Acrobat X Pro 中缩小页面大小?

我在朋友家的扫描仪上扫描了一份文档,最终 pdf 的大小为 35 英寸 x 45 英寸。我认为这是我发送给它的人遇到麻烦的原因,他们收到错误“图像不足”。

我如何在 Adob​​e Acrobat X Pro 中将其缩小到普通的 8.5x11 英寸纸张,以便我可以查看是否解决了他们的问题,并且我可以与他们共享文档。我无法重新扫描文档,因为我不再拥有它。

Acrobat 在 Windows 7 操作系统上运行。扫描仪是 HP OfficeJet Pro L7650 一体机。

windows-7 scanning scaling adobe-acrobat

2
推荐指数
1
解决办法
3万
查看次数

如何扫描这些小卡片?

我正在翻阅一盒旧照片,我发现了其中一些人:

旧投影仪幻灯片

我以前从未见过他们。我用平板扫描仪扫描了这个,但结果不是很好。当我仔细查看它时,质量要好得多。扫描这些有技巧吗?我想把它们数字化。

scanning

1
推荐指数
1
解决办法
172
查看次数