我有5个PDF文件,每个文件都有指向另一个PDF文件中不同页面的链接.这些文件是大型PDF的每个目录(每个约1000页),使手动提取成为可能,但非常痛苦.到目前为止,我已经尝试在Acrobat Pro中打开该文件,我可以右键单击每个链接并查看它指向的页面,但我需要以某种方式提取所有链接.我不反对不得不对链接进行大量的进一步解析,但我似乎无法以任何方式将它们拉出来.我试图将Acrobat Pro中的PDF导出为HTML或Word,但这两种方法都没有维护链接.
我的智慧结束了,任何帮助都会很棒.我很乐意使用Python或其他一系列语言