如何使用iText java读取PDF中的表格?

sou*_*jee -1 java pdf itext

我对使用java的pdf处理不太了解.我想使用iText java库读取PDF文件中的表.如何进行?

Fra*_*ner 6

您可以从内容流中提取文本,但对于普通PDF,结果将是纯文本(没有任何结构).如果页面上有表格,则该表格不会被识别.您将获得内容和一些空白区域,但这不是表格结构!只有拥有标记的PDF,才能获得XML文件.如果PDF包含被识别为表标记的标记,则这将反映在PDF中.

这就是我在这里发现的