我想要一个python函数,它接受pdf并返回文档中注释注释的文本列表.我看过python-poppler(https://code.launchpad.net/~poppler-python/poppler-python/trunk),但我无法弄清楚如何让它给我任何有用的东西.
我找到了get_annot_mapping
方法并修改了提供的演示程序来调用它self.current_page.get_annot_mapping()
,但我不知道如何处理AnnotMapping对象.它似乎没有完全实现,只提供复制方法.
如果有任何其他库提供此功能,那也没关系.