Ank*_*kit 33 format-conversion
我想将.pdf文件转换为文件,.odt以便我可以进一步将其转换为.doc文件。是否有任何软件/脚本可以做到这一点。我试图复制文件的内容.pdf并将其粘贴到 liberoffice writer 中,但格式未保留。
该文件是保密的,所以我不想使用任何在线服务进行转换。
任何帮助都受到高度赞赏。
小智 16
您可以查看PDF Utilities(通过 Synaptic 或 apt-get 使用 poppler-utils),其中包括pdftotext:
Poppler 是一个基于 Xpdf PDF 查看器的 PDF 渲染库。
该软件包包含命令行实用程序(基于 Poppler),用于获取 PDF 文档的信息、将它们转换为其他格式或操作它们:
* pdfdetach -- 列出或提取嵌入的文件(附件)
* pdffonts -- 字体分析器
* pdfimages --图像提取器
* pdfinfo -- 文档信息
* pdfseparate -- 页面提取工具
* pdftocairo -- 使用 Cairo 的 PDF 到 PNG/JPEG/PDF/PS/EPS/SVG 转换器
* pdftohtml -- PDF 到 HTML 的转换器
* pdftoppm -- PDF 到 PPM /PNG/JPEG 图像转换器
* pdftops -- PDF 到 PostScript (PS) 转换器
* pdftotext -- 文本提取
* pdfunite -- 文档合并工具
当然,成功将取决于 pdf 文件的生成方式。如果你得到你想要的文本文件,你可以将它保存为 .odt 文件。
编辑:我忘了提供报价的来源。它来自 Synaptic 中的描述选项卡PDF Utilities (based on Poppler).
小智 15
我也对缺少免费的 PDF 到 ODT 转换器感到恼火。我什至不需要任何复杂的东西。只是一个生成 ODT 文件的工具,然后我可以在 LibreOffice 中对其进行注释(例如填写表格)。
我知道如何手动执行此操作,方法是将 PDF 文档转换为图形文件,然后将它们导入 LibreOffice,但这很快就会变得乏味。
所以,我终于写了一个快速的小 shell 脚本,它自动完成所有必需的步骤。你可以在https://github.com/gutschke/pdf2odt找到它
它可以将任意数量的 PDF 和图像文件作为输入并生成可在 LibreOffice 中打开和编辑的 ODT 文件。图像显示为页面背景,因此您可以自由书写。每个图像都与其自己的页面样式相关联。在插入分页符并根据需要调整页面样式时,请记住这一点。
我在 Linux 和 Mac 上测试了该脚本。鉴于它只需要一些合理的标准工具,它应该是非常便携的。
ben*_*der 11
LibreOffice 能够导入.pdf文件。只需在当前版本的 LibreOffice 中打开它即可获得最佳效果。但是,它会将文档作为绘图打开,并且您只能将其转换为一种支持的图像格式,而不是作为 Writer 文档。
当然,并非所有格式都被保留,但至少保留了一些。
小智 5
试试口径。它转换为 html,然后转换为其他格式。它在一个大文件(183 页)上做得非常好,否则我不得不打印。
就我而言,我将其转换为 epub,但为了好玩,我只是将其转换为 .docx,结果非常好。