我在无头模式下使用libreoffice将HTML转换为各种格式.对于这个问题,我们将简单地使用docx.
我使用类似这样的命令:
libreoffice --headless --convert-to docx:"MS Word 2007 XML" --writer document.html
Run Code Online (Sandbox Code Playgroud)
这在大多数情况下都很有效.
HTML包含一些图像的绝对链接.
<img src="http://myserver.com/image1.jpg" />
Run Code Online (Sandbox Code Playgroud)
当文档转换为document.docx时,图像仍然链接到文档,而不是嵌入到文档中.当您处于离线状态以及预览状态时,这会导致问题.
有没有办法告诉libreoffice下载并将图像直接嵌入到文档中,而不是仅仅将它们保存为链接图像?