我想从具有自定义页码的 PDF 文件中提取页面,例如,有编号为 C1、C2、C3 的页面,然后从 1、2、3、4 等开始。
当我使用
$ gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dSAFER \
-dFirstPage=22 -dLastPage=36 \
-sOutputFile=outfile_p22-p36.pdf 100p-inputfile.pdf
Run Code Online (Sandbox Code Playgroud)
FirstPage 和 LastPage 是页面索引,从第一页开始计数 - 这不是我想要的
我如何告诉 GhostView 使用“真实”页码?
小智 4
如果您了解有关 Ghostscript PDF 解释器内部结构的大量知识,您就可以访问页码。这需要大量查看 Resource/Init/pdf*.ps 文件(主要是 pdf_main.ps)并了解 PostScript,但这是可能的。只是不适合胆小的人。
要查看在 PDF 中挖掘信息以收集信息的 PS 程序示例,请查看 toolbin/pdf_info.ps。
如果有人想出一个补丁来允许 FirstPage/LastPage 将名称作为标签,那么我们会考虑它。该补丁的一部分应该是更改,在 pdf_info.ps 中添加一个选项来打印标签和实际页码。