PDF:检测和裁剪多个页面?

fdm*_*ion 7 pdf

我在我的大学使用高速扫描仪将书的某些部分扫描成 PDF。扫描仪生成的 PDF 文件只是原样存储的文档相机拍摄的图像。换句话说,我们有 30 个 PDF 页面,代表 60 个打印页面。

该机器能够进行大规模扫描,因此其扫描面积比普通书籍大得多。这意味着图像也有很多边框。表格是黑色的,页面明显是白色的,所以看起来软件应该能够自动裁剪。

我正在寻找某种解决方案,可以遍历 PDF 并提取出两页以及删除它们周围的边框,并生成固定结果的新 PDF。换句话说,我想要一个 60 页的 PDF,去掉边框。我计划通过 ABBYY FineReader for OCR 传递处理后的 PDF。

有没有人对如何做到这一点有任何想法?

Bri*_*n Z 2

这些免费工具看起来很适合您的目的:ScantailorBookscanner

如果您可以访问 Adob​​e Acrobat,我就是这样做的。基本工作流程是将图像合并成 PDF,一次从所有页面中裁剪出多余的黑色空间,复制每个页面,分两批裁剪偶数和奇数页面以将其切成两半,然后进行 OCR。