Fur*_*ish 5 pdf merge microsoft-word
我正在使用 MS Word,有很多地方我关心文档的最终外观。我不想分割某些部分(例如粘贴的源代码)。我也不想将这些部分变成对象,因为虽然它会使它们保持不分离,但它会经常在它们周围的文档中添加填充空白。Web 布局对于开发来说效果很好,但最终我会将文档导出为 PDF。我希望生成的 PDF 只有一页很长。
如何将 MS Word 文档导出为 PDF,以便生成的文件仅包含一页(合并所有页面的结果,内容之间没有看似随机的页眉和页脚)?
我认为 PDF 编辑器解决方案不会为您提供真正的单个连续页面。我认为它仍然包含分页符。
相反,有一种不同的方法可以解决这个问题。
首先,您需要将 Word 文档转换为 HTML。我喜欢这个在线服务用于此目的,但您也可以使用pandoc将 docx 转换为 html,例如:
pandoc --extract-media='media' -s your_file.docx -t html -o your_file.html
Run Code Online (Sandbox Code Playgroud)
然后,您需要将 HTML 转换为真正连续的单页 PDF。可以这样做:
获取wkhtmltopdf
- https://wkhtmltopdf.org/downloads.html(不要忘记添加路径!)
打开终端并执行
wkhtmltopdf -T 0 -B 0 --page-width 210mm --page-height 594mm input.html output.pdf
Run Code Online (Sandbox Code Playgroud)
在这里,将--page-height
word文档中的参数更改为(297*A4页数)。例如,2张A4纸变成2*297 = 594mm
对于包含额外文件的更复杂的文件,请提取.zip
第一个文件,然后使用
wkhtmltopdf -T 0 -B 0 --page-width 210mm --page-height 594mm --enable-local-file-access input.html output.pdf
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
4715 次 |
最近记录: |