如何使用pdfbox解析包含表格格式数据的pdf

its*_*vks 5 java pdf parsing web-applications itext

任何人都可以帮助我如何使用itext或pdfbox提取表数据,我有一个1000页的pdf,我的工作是解析PDF并将数据存储到数据库中.

mar*_*ens 4

PDF 不包含任何表结构元素,除非包含额外的 XML 来定义表。否则就没有结构。我写了一篇关于如何找出答案的博客文章。

有些工具(例如 PdfBox)会努力猜测表格,但它可能会碰运气