iText:将PDF分成几个PDF(每页1个)

Tha*_*ham 3 java itext

我想要的是:给定一个10页的pdf文件,我想在网络上的表格中显示该pdf的每个页面.实现这一目标的最佳方法是什么?我想一种方法是将这个10页的pdf文件分成10个1页的pdf,并以编程方式将每个pdf显示在一个表的一行上.我可以用iText这样做吗?有没有更好的方法来实现这一目标?

Rea*_*wTo 15

拆分PDF文件(使用iText)

import java.io.FileOutputStream;

import com.lowagie.text.Document;
import com.lowagie.text.pdf.PdfCopy;
import com.lowagie.text.pdf.PdfImportedPage;
import com.lowagie.text.pdf.PdfReader;

public class SplitPDFFile {

    /**
     * @param args
     */
    public static void main(String[] args) {

        try {
            String inFile = args[0].toLowerCase();
            System.out.println ("Reading " + inFile);
            PdfReader reader = new PdfReader(inFile);
            int n = reader.getNumberOfPages();
            System.out.println ("Number of pages : " + n);
            int i = 0;            
            while ( i < n ) {
                String outFile = inFile.substring(0, inFile.indexOf(".pdf")) 
                    + "-" + String.format("%03d", i + 1) + ".pdf"; 
                System.out.println ("Writing " + outFile);
                Document document = new Document(reader.getPageSizeWithRotation(1));
                PdfCopy writer = new PdfCopy(document, new FileOutputStream(outFile));
                document.open();
                PdfImportedPage page = writer.getImportedPage(reader, ++i);
                writer.addPage(page);
                document.close();
                writer.close();
            }
        } 
        catch (Exception e) {
            e.printStackTrace();
        }

        /* example : 
            java SplitPDFFile d:\temp\x\tx.pdf

            Reading d:\temp\x\tx.pdf
            Number of pages : 3
            Writing d:\temp\x\tx-001.pdf
            Writing d:\temp\x\tx-002.pdf
            Writing d:\temp\x\tx-003.pdf
         */

    }
}
Run Code Online (Sandbox Code Playgroud)

这里有很多iText示例.

  • 有没有办法在内存中执行此操作,以便不生成实际文件?我想遍历所有页面并将每个页面发送到OCR以读取文本. (3认同)