小编abh*_*rma的帖子

我们如何从没有页眉和页脚的 PDF 文件中提取文本内容

我们如何从 PDF 文件中提取文本内容,我们正在使用 pdfbox 从 PDF 文件中提取文本,但我们不需要页眉和页脚。我正在使用以下 java 代码。

PDFTextStripper stripper = null;
  try {
    stripper = new PDFTextStripper();
   } catch (Exception e) {
      // TODO Auto-generated catch block
      e.printStackTrace();
   }
     stripper.setStartPage(pageCount);
     stripper.setEndPage(pageCount);
   try {
      String pageText = stripper.getText(document);
       System.out.println(pageText);  
    } catch (Exception e) {
     // TODO Auto-generated catch block
     e.printStackTrace();
 }
Run Code Online (Sandbox Code Playgroud)

java pdf itext pdfbox itextpdf

2
推荐指数
1
解决办法
4510
查看次数

标签 统计

itext ×1

itextpdf ×1

java ×1

pdf ×1

pdfbox ×1