将pdf中的表格复制为表格?

mat*_*kie 6 windows microsoft-office

如何将 PDF 文档中的表格作为表格而不是纯文本复制或导出到 Word、Excel、OneNote 等?

示例 pdf:ftp : //ftp2.cits.rncan.gc.ca/pub/canvec/doc/CanVec_transition_guide_en.pdf,从第 9 页开始。我使用的是 Office 2003,OneNote 试用版 2007。

小智 6

您可以通过http://windows.kde.org/ installer使用 Linux 和 Windows 上可用的 Okular 文档查看器。

它可以选择文本作为表格,您可以在其中定义行和列。


Chu*_*eto 5

MirzaD,感谢您推荐 Okular。我已经将它安装在我的 ubuntu 桌面上,并且从来没有认真对待过......直到现在。谢谢你。

Okular is awesome在它包含的功能中,当然可以满足提出问题的人的需求。使用 Okular,您使用 aTable Selection Tool并定义一个区域,然后在列边框中单击以标记字段 .. 然后复制。粘贴时,您会获得一致的制表符分隔输出,任何严肃的工具都可以将其作为 CSV 文件进行处理。

我现在在运行 gnome/xfce 的 Centos 桌面上有这个需求(从 PDF 文档中提取一些表格),安装 okular 意味着安装一大堆其他 KDE 图形工具。因此,我将首先尝试使用 tabula(这看起来也很有希望),如果失败,则必须使用 okular。

这适用于Windows吗?是的,KDE 可以安装在 Windows 中,但是 KDE 应用程序会带来一些其他不必要的软件的可观开销..所以,这取决于您的需求有多大,这对于 Windows 来说也是一个可行的选择。

在此处阅读有关 Okular 的更多信息.. 他们的口号More Than a Reader当然适合 .. 我对 Okular 的功能印象深刻.. 在一个简洁、足够快、占用空间小的应用程序中。

KDE Windows 项目.. 使在Windows中安装优秀 KDE 应用程序的子集变得容易。


小智 4

您可以尝试Tabula - 对于放置在表格中的面向数据的内容非常有效。

可以在主页上找到简短的介绍。

使用此问题所附 PDF 工具,您必须:

  1. 将文件下载到本地磁盘。
  2. 按照主页上的说明安装并启动该工具。
  3. 上传 PDF 并选择“提交”
  4. 导航到第一个表并选择该表。确保您没有选择页面的页眉和页脚以获得更准确的结果。 Tabula - 表选择
  5. 如果您还想使用相同的坐标选择下表,请选择重复此选择。
  6. 选择下载所有数据即可。 Tabula - 提取的表格数据
  7. 选择下载数据以获取包含提取的表的 CSV 文件。该文件可以使用 MS Excel 或任何其他可以读取 CSV 格式以进行进一步处理的应用程序打开。