使用Python突出显示PDF中的文本

Kat*_*sis 6 python pdf search pypdf pdfminer

我正在为我的PDF数据集开发自定义搜索引擎。

我有一个转换层,可以将PDF内容转储到文本中(使用Apache Tika和GROBID)。我已经完成搜索层和返回搜索结果列表的视图。

现在,我想在原始PDF上为出现搜索字词的行添加突出显示功能。是的,如果需要,我想修改PDF文件。

有什么办法可以突出显示PDF文件中的文本?PDFMiner或PyPDF2或其他Python库是否可以做到这一点?

...还是可以要求其他服务,也许是外部服务?

spa*_*ain 8

您可以使用PyPDF2突出显示文本。

为了找到文本的位置,请查看此答案