use*_*081 5 pdf text-processing pdftk libreoffice
我需要在 debian 服务器上将 1K pdf 文件转换为 doc。我可以使用 libreoffice 命令行将 PDF 转换为 Word:
libreoffice --headless --invisible --convert-to doc Sample-doc-file-100kb.pdf
Run Code Online (Sandbox Code Playgroud)
或使用办公室:
soffice --nocrashreport --nologo --nolockcheck --nofirststartwizard --invisible --headless --convert-to doc Sample-doc-file-100kb.pdf
Run Code Online (Sandbox Code Playgroud)
上述两个命令的主要问题是 doc 文件在页面中不包含图像,它只包含格式化的文本。有没有更好的方法将 pdf 转换为 doc,包括 pdf 中存在的图像?我对像 zamzam 这样的 Web 服务不感兴趣,我需要从服务器上的命令行执行此操作。谢谢你。