小编Raj*_*Raj的帖子

用 Java 将 PDF 转为 Excel

我正在将数据从 PDF 转换为 Excel。PDF 包含表格。我使用 Itext-pdf 读取数据,并在 apache poi 的帮助下将其转换为 excel。但所有内容都转换为文本,甚至表格行和列。我喜欢把表格写成行和列,就像在 PDF 中一样,所以请帮助我阅读 PDF 中的表格以写入 Excel。

这是我的代码:

PdfReader reader;
try {
    reader = new PdfReader("D:/JDEV_WORK/MANOJ/ItemPriceReport.pdf");
    PdfReaderContentParser parser = new PdfReaderContentParser(reader);
    TextExtractionStrategy strategy;
    String line = null;
    for (int i = 1; i <= reader.getNumberOfPages(); i++) {
        strategy = parser.processContent(i,new SimpleTextExtractionStrategy());
        line = strategy.getResultantText();
        System.out.println("line --- "+line);
    }

//conversion starts here....

HSSFRow myRow = null;
HSSFCell myCell = null;
CreationHelper helper = myWorkBook.getCreationHelper();
List<String> lines = IOUtils.readLines(new StringReader(line));

for (int i …
Run Code Online (Sandbox Code Playgroud)

java itext apache-poi

2
推荐指数
1
解决办法
3826
查看次数

标签 统计

apache-poi ×1

itext ×1

java ×1