如何将PDF文件转换为电子表格

Ser*_*gio 14 pdf ubuntu converter spreadsheet libreoffice

我一整天都在尝试转换几个.包含圣保罗交通流量的PDF文件,如MS Office Excel或Ubuntu中的LibreOffice Calc.当我用LibreOffice Calc打开.pdf文件时,它打开了LibreOffice Draw,我无法获得电子表格.

我发现最有前途的方法是在这里与pdftotext.它工作正常,我可以在LibreOffice Calc中获取表格,但手动调整列.

我的问题是我有这么多的.pdf文件,这会花费我很多时间.

有谁知道更好的方法?

小智 23

另一种选择是使用Okular(http://okular.kde.org).它有表选择工具(Ctrl + 5).您可以选择一个表,为其他行和列添加行,并将生成的表复制到剪贴板中.这对我来说可以.

  • Okular在我遇到的困难桌子上比预期的效果更好.好推荐 (3认同)

scr*_*uss 13

Tabula可以很好地工作.PDF不是从中提取结构化信息的简单格式,因此并非总是可行.

  • 这些年后我可以说 Tabula 是最好的 (2认同)

toh*_*ohu 11

也许这-layout对你有用.设置此选项后,pdftotext将尝试将列布局保留在生成的文本文件中.

现在,您可以使用适当的导入设置将文本文件导入LibreOffice Calc.txt在Calc中打开文件时,系统会询问您如何解析文件内容(请参见下面的屏幕截图).在Separator Options,选择选项[separated by] SpaceMerge Delimiters.这样,Calc就能够恢复列结构(假设单元格数据不包含空格).

文本导入计算