我正在将数据从 PDF 转换为 Excel。PDF 包含表格。我使用 Itext-pdf 读取数据,并在 apache poi 的帮助下将其转换为 excel。但所有内容都转换为文本,甚至表格行和列。我喜欢把表格写成行和列,就像在 PDF 中一样,所以请帮助我阅读 PDF 中的表格以写入 Excel。
这是我的代码:
PdfReader reader;
try {
reader = new PdfReader("D:/JDEV_WORK/MANOJ/ItemPriceReport.pdf");
PdfReaderContentParser parser = new PdfReaderContentParser(reader);
TextExtractionStrategy strategy;
String line = null;
for (int i = 1; i <= reader.getNumberOfPages(); i++) {
strategy = parser.processContent(i,new SimpleTextExtractionStrategy());
line = strategy.getResultantText();
System.out.println("line --- "+line);
}
//conversion starts here....
HSSFRow myRow = null;
HSSFCell myCell = null;
CreationHelper helper = myWorkBook.getCreationHelper();
List<String> lines = IOUtils.readLines(new StringReader(line));
for (int i …Run Code Online (Sandbox Code Playgroud)