相关疑难解决方法(0)

使用PDFBox从特定页面读取文本

我知道如何使用PDFBox来阅读整个pdf文件的文本PDFTextStripper.getText(PDDocument).

我还有一个关于如何使用特定页面获取对象引用的示例PDDocumentCatalog.getAllPages().get(i).

如何使用PDFBox获取一个页面的文本,因为我在PDPage课堂上没有看到任何这样的方法?

java pdfbox

11
推荐指数
1
解决办法
2万
查看次数

是否可以使用Apache Tika逐页提取word/pdf文件?

我能找到的所有文档似乎都暗示我只能提取整个文件的内容.但我需要单独提取页面.我需要为此编写自己的解析器吗?有一些我遗漏的明显方法吗?

text apache-tika

10
推荐指数
3
解决办法
9529
查看次数

标签 统计

apache-tika ×1

java ×1

pdfbox ×1

text ×1