如何在 Linux 中将 Word (doc) 转换为 PDF?

49 linux pdf conversion microsoft-word

我有一组.doc格式的文件,需要转换为.pdf格式。我正在使用 Ubuntu linux。

Meh*_*lar 32

替代方案 1)

sudo apt-get install cups-pdf
Run Code Online (Sandbox Code Playgroud)

然后导航到系统 > 管理 > 打印并创建一个新打印机,将其设置为 PDF 文件打印机,并将其命名为“pdf”。

然后运行:

oowriter -pt pdf your_word_file.doc
Run Code Online (Sandbox Code Playgroud)

现在您将在 ~/PDF 中找到您的 .pdf 文件。


备选方案 2)

sudo apt-get install wv tetex-extra ghostscript  
wvPDF test.doc test.pdf
Run Code Online (Sandbox Code Playgroud)

如果 tetex-extra 包在您的发行版中不可用,请尝试使用 texlive-base 和 texlive-latex-base:

sudo apt-get install wv texlive-base texlive-latex-base ghostscript  
wvPDF test.doc test.pdf
Run Code Online (Sandbox Code Playgroud)

  • OpenOffice 现在一般被 LibreOffice 取代,所以命令是 `lowriter` (3认同)
  • 对于 LibreOffice,命令是`lowriter --convert-to pdf your_word_file.doc`,默认是在当前目录中输出。 (3认同)

小智 14

您可以使用:

oowriter -convert-to pdf:writer_pdf_Export doc_file.doc
Run Code Online (Sandbox Code Playgroud)

  • 在使用默认 LibreOffice 的 Ubuntu 12.04 上,我不得不使用 `lowriter` 而不是 (oo|s|)writer。然后它使用与上面相同的参数:`lowriter -convert-to pdf:writer_pdf_Export file.docx`。.pdf 在当前目录中创建。 (4认同)
  • 简短而简单——但是,如果运行 LibreOffice(或运行 OO.org 并且找不到 `oowriter`)——命令是 `swriter -convert-to pdf:writer_pdf_Export x.doc`。 (2认同)

Tob*_*obu 12

打印为 PDF 会丢失很多文档元数据(标题、作者、用于导航的标题树等)。

安装 unoconv,转换为:unoconv -fpdf file1.doc file2.doc…


Whe*_*ice 11

如果您正在运行 X,那么您可以通过 Open Office 来完成。由于您将反对手动执行此操作,请记住 Open Office 中有一些不错的宏脚本,以便您可以自动执行。您可以使用 AbiWord (AbiWord --to=pdf) 执行类似操作。

如果你没有 X 则有 antiword,但它只是提取文本 - 不做任何格式或图形。还有wvWare,我曾经用它从 doc 文件中批量提取图像,但我从未尝试过使用它来将 doc 文件转换为 pdf。

哦和 .docx 文件可能需要不同的东西,但由于它们只是压缩的 xml 文件,因此对它们做一些有用的事情应该不会太难。对于批量提取图像,您只需解压缩它们并复制图像目录,但我从未需要在 Linux 中转换它们。


cam*_*ino 10

如果您已经安装了 LibreOffice

lowriter --headless --convert-to pdf *.doc 
Run Code Online (Sandbox Code Playgroud)


fra*_*ous 5

你也可以用AbiWord做到这一点:

sudo apt-get install abiword

然后您可以在 AbiWord 的 GUI 中加载 .doc 文件并导出为 PDF,或从命令行:

abiword --to=pdf filename.doc