如何从多个PDF文件中删除第一页

Tri*_*ard 2 pdf

我有一个PDF集合,有时会有一个我要删除的文档第一页的信息页面.

如果有一种快速的方法可以从我的所有pdf中删除这个信息页面,或者至少可以显示所有包含多个页面的pdf,那么我可以更好地找到需要修复的那些页面?

你知道任何可以做到这一点的程序吗?或者用python做到这一点的方法?

注意:信息页面上有文字,它始终保持相同的"LAND TITLE OFFICE"

使用Windows 7操作系统

谢谢

一些研究发现如下:

http://www.python.org/workshops/2002-02/papers/17/index.htm

http://www.unixuser.org/~euske/python/pdfminer/index.html

http://pybrary.net/pyPdf/pythondoc-pyPdf.pdf.html#pyPdf.pdf.PdfFileWriter-class

Chr*_*now 5

您可以使用opensource PDFBox作为命令行实用程序来拆分PDF.

PDFBox的链接在这里:链接

使用PDFBox拆分PDF的文档在这里:链接

您可以使用批处理脚本中的PDFBox提取文本功能,并与grep结合使用以识别包含您要查找的文本的页面.提取文本文档在这里:链接


enr*_*cis 5

您可以尝试以下两种方式:

  • PdfTK是一个操作PDF的实用程序.检查这个链接,他们正在做一些类似于你需要的东西(在评论中有人也发布了一个Windows脚本)

  • PDFsam是一个图形化的强大工具,可以批量处理PDF.拆分+合并部分应该可以解决问题.

它们都是免费的,如果你想写一个你可以经常使用的"食谱",我建议先研究第一个,但是后者如果你必须这样做一次.