从pdf中提取评论

Rob*_*ord 6 pdf r

我有一组 .pdf 文件,其中包含在 Adob​​e Acrobat 中添加的注释。我希望能够分析这些评论,但我有点坚持提取它们。我查看了 pdftools 包,但它似乎只能提取文本而不能提取注释。是否有一种方法可用于提取 R 中的注释?

小智 8

PyMuPDF(https://pymupdf.readthedocs.io/en/latest/)是我发现的唯一可以工作的Python库。

在基于 Debian/Ubuntu 的发行版中安装:

apt-get install python3-fitz
Run Code Online (Sandbox Code Playgroud)

脚本:

apt-get install python3-fitz
Run Code Online (Sandbox Code Playgroud)


小智 0

您是否尝试过 PoDoFo 或其他可以访问 PDF 元素的开源工具?如果您很少进行编程,您还可以在 stackoverflow 上查看Extracting PDF annotations/comments