读取,突出显示,以编程方式保存PDF

Jak*_*ake 11 python linux pdf poppler

我想编写一个小脚本(将在无头Linux服务器上运行)来读取PDF,突出显示与我传递的字符串数组中的任何内容匹配的文本,然后保存修改后的PDF.我想我最终会使用类似python绑定到poppler的东西,但不幸的是,接下来只有零文档,我接下来没有python的零经验.

如果有人能指出我的教程,示例或一些有用的文档,让我开始,将不胜感激!

Alb*_*ien 3

您尝试过查看PDFMiner吗?听起来它就像你想要的那样。

  • 据我所知,PDFMiner 的目标是 PDF-> 文本提取;它看起来不能突出显示更改后的 PDF 并将其渲染到文件中。 (3认同)