我知道如何使用PDFBox来阅读整个pdf文件的文本PDFTextStripper.getText(PDDocument).
PDFTextStripper.getText(PDDocument)
我还有一个关于如何使用特定页面获取对象引用的示例PDDocumentCatalog.getAllPages().get(i).
PDDocumentCatalog.getAllPages().get(i)
如何使用PDFBox获取一个页面的文本,因为我在PDPage课堂上没有看到任何这样的方法?
PDPage
java pdfbox
我能找到的所有文档似乎都暗示我只能提取整个文件的内容.但我需要单独提取页面.我需要为此编写自己的解析器吗?有一些我遗漏的明显方法吗?
text apache-tika
apache-tika ×1
java ×1
pdfbox ×1
text ×1