某些PDF查看器/编辑器中是否有任何工具,如Acrobat,Evince等,我可以在其中导航和观察PDF文档中任何选定点的坐标(即(x,y))?
我正在为我的PDF数据集开发自定义搜索引擎。
我有一个转换层,可以将PDF内容转储到文本中(使用Apache Tika和GROBID)。我已经完成搜索层和返回搜索结果列表的视图。
现在,我想在原始PDF上为出现搜索字词的行添加突出显示功能。是的,如果需要,我想修改PDF文件。
有什么办法可以突出显示PDF文件中的文本?PDFMiner或PyPDF2或其他Python库是否可以做到这一点?
...还是可以要求其他服务,也许是外部服务?
您好,我正在尝试更改 pdf 中的突出显示颜色,但无法执行此操作。默认突出显示颜色是黄色,但我想更改它以下是我的代码:
import fitz
doc = fitz.open(r"path\input.pdf")
page=doc[0]
text="some text"
text_instances = page.searchFor(text)
for inst in text_instances:
highlight = page.addHighlightAnnot(inst)
highlight.setColors(colors='Red')
highlight.update()
doc.save(r"path\output.pdf")
Run Code Online (Sandbox Code Playgroud)
另外我如何一起搜索整个 pdf 而不仅仅是一页
以及如何突出显示 pdf 中给出的图像上的文本