给定一个图像,里面有一些实际的内容,通常有一些不需要的白色或黑色或透明度,我想使用 ImageMagick 修剪或裁剪外部部分。
以下图像是在计算机上以数字方式绘制的(在 HTML 上<canvas>):
以下 ImageMagick 命令是我尝试过的:
$ convert canvas.png -trim +repage canvas_trimmed.png
Run Code Online (Sandbox Code Playgroud)
它工作得很好:
所以这正是我想要的。但现在我希望它也适用于扫描文档,这些文档不像计算机生成的图像那样“完美”,即它们具有更多的“白色”和“黑色”阴影,并且没有更容易检测的透明度。有时,他们甚至会在纸张的白色背景周围出现一些黑条,因为扫描仪的区域比纸张大:
对于这张图片,我按照给定的顺序尝试了以下命令,每个命令都试图更加激进,但没有产生任何结果 - 您看不到原始图像和“修剪”图像之间的任何区别,即修剪或裁剪根本不起作用:
$ convert scan.jpg -trim +repage scan_trimmed.jpg
$ convert scan.jpg -fuzz 10% -trim +repage scan_trimmed.jpg
$ convert scan.jpg -fuzz 60% -trim +repage scan_trimmed.jpg
$ convert scan.jpg -fuzz 60% -bordercolor white -border 1x1 -trim +repage scan_trimmed.jpg
$ convert scan.jpg -fuzz 60% -bordercolor black -border 1x1 -trim +repage scan_trimmed.jpg
Run Code Online (Sandbox Code Playgroud)
我在这里做错了什么?如何修改能够可靠地修剪计算机生成图像的 ImageMagick 命令,使其能够同样可靠地修剪上述样式的扫描文档?
如果我想扫描一个文档,10 页,每页为 PDF 300dpi,灰度。10 页 6MB.. 40 页 24MB。美好的。彩色,每页25MB 为什么彩色是25MB?
PDF效率很低吗?它可以处理文本和图像。
但一个更大的问题,
比那更疯狂.. 我将 10 页扫描成一个文档。它在我的 TEMP 文件夹中占用 1GB。一千兆!!!它处理它然后释放 1GB。
但是为什么在处理过程中多达 1GB !对于 6MB 的文档!
我认为它在这里 C:\Documents and Settings\user\Local Settings\Temp\MaglevExpressTemp
软件是 HP 解决方案中心。
其他软件会占用那么多空间吗?有些比其他的差吗?我不应该为我的 HP 扫描仪使用 HP 解决方案中心吗?
我有一个相当大的项目,最终将造福社会,我正在寻找我能召集的所有帮助。我有大约 130,000 页需要数字化。它们中的许多都装在有订书钉的包装里,或者是用了 40 多年的纸(与今天的纸相比非常薄)。其中一些尺寸奇怪(全尺寸合法,地图和小明信片尺寸......)。但是,我们只有大约 10 天的时间来处理这项工作(一旦我们到达现场)。我们可以通宵工作。
我有一个 6 人的团队,我们完成这项任务的预算相对较少。我们考虑过现代扫描仪(例如进纸托盘 fujitsu scansnap),它可以以约 25ppm(每分钟页数)的速度处理页面,但我们担心页面被撕裂或卡住(并且我们正在努力不危及原件) . 还有订书钉的问题(可以删除......)。我们可以做平板,但是哇,手动完成这是一项艰巨的工作!对于非常大的零件,我们总是可以这样做。
我希望你们对如何实现这一点有一些非常聪明的想法......非常感谢您的时间和帮助
编辑似乎组合方法(高级纸扫描仪 + 垂直复印架)效果最好,以确保所需的页数/分钟。一个离线建议:复印机?如果我们先简单地复印整个收藏,然后让复印机继续发送数字,或者在扫描仪中复印复印件,我们会假设会发生什么。对我来说这似乎是双重工作,但我对技术的胆量不够熟悉,无法更好地了解。
我试过使用组合
我不确定 ZoHoViewer 产品的好坏,但以下几点:
Als Arbeitsmarkbehörde haben wir den gesetzlichen Auftrag, die Vermittelbarkeit von
变成:
AlsArbeitsmarktbeh6rde habenwirdengesetzlichenAuftrag,dieVermittelbarkeit vonSt...
因此,goog docs 使尝试翻译它成为猪的早餐。
有没有人有更好的建议(最好是免费的在线服务)
我在朋友家的扫描仪上扫描了一份文档,最终 pdf 的大小为 35 英寸 x 45 英寸。我认为这是我发送给它的人遇到麻烦的原因,他们收到错误“图像不足”。
我如何在 Adobe Acrobat X Pro 中将其缩小到普通的 8.5x11 英寸纸张,以便我可以查看是否解决了他们的问题,并且我可以与他们共享文档。我无法重新扫描文档,因为我不再拥有它。
Acrobat 在 Windows 7 操作系统上运行。扫描仪是 HP OfficeJet Pro L7650 一体机。