如何将整个 MS Word 文档保存为单页 PDF?

Fur*_*ish 5 pdf merge microsoft-word

我正在使用 MS Word,有很多地方我关心文档的最终外观。我不想分割某些部分(例如粘贴的源代码)。我也不想将这些部分变成对象,因为虽然它会使它们保持不分离,但它会经常在它们周围的文档中添加填充空白。Web 布局对于开发来说效果很好,但最终我会将文档导出为 PDF。我希望生成的 PDF 只有一页很长

如何将 MS Word 文档导出为 PDF,以便生成的文件仅包含一页(合并所有页面的结果,内容之间没有看似随机的页眉和页脚)?

Saa*_*arg 5

我认为 PDF 编辑器解决方案不会为您提供真正的单个连续页面。我认为它仍然包含分页符。

相反,有一种不同的方法可以解决这个问题。
首先,您需要将 Word 文档转换为 HTML。我喜欢这个在线服务用于此目的,但您也可以使用pandoc将 docx 转换为 html,例如:

pandoc --extract-media='media' -s your_file.docx -t html -o your_file.html
Run Code Online (Sandbox Code Playgroud)

然后,您需要将 HTML 转换为真正连续的单页 PDF。可以这样做:

  1. 获取wkhtmltopdf- https://wkhtmltopdf.org/downloads.html(不要忘记添加路径!)

  2. 打开终端并执行

    wkhtmltopdf -T 0 -B 0 --page-width 210mm --page-height 594mm input.html output.pdf
    
    Run Code Online (Sandbox Code Playgroud)

    在这里,将--page-heightword文档中的参数更改为(297*A4页数)。例如,2张A4纸变成2*297 = 594mm

对于包含额外文件的更复杂的文件,请提取.zip第一个文件,然后使用

wkhtmltopdf -T 0 -B 0 --page-width 210mm --page-height 594mm --enable-local-file-access input.html output.pdf
Run Code Online (Sandbox Code Playgroud)