小编Kat*_*sis的帖子

使用Python突出显示PDF中的文本

我正在为我的PDF数据集开发自定义搜索引擎。

我有一个转换层,可以将PDF内容转储到文本中(使用Apache Tika和GROBID)。我已经完成搜索层和返回搜索结果列表的视图。

现在,我想在原始PDF上为出现搜索字词的行添加突出显示功能。是的,如果需要,我想修改PDF文件。

有什么办法可以突出显示PDF文件中的文本?PDFMiner或PyPDF2或其他Python库是否可以做到这一点?

...还是可以要求其他服务,也许是外部服务?

python pdf search pypdf pdfminer

6
推荐指数
1
解决办法
6539
查看次数

标签 统计

pdf ×1

pdfminer ×1

pypdf ×1

python ×1

search ×1