从bash命令行将PDF转换为word的正确方法

use*_*081 5 pdf text-processing pdftk libreoffice

我需要在 debian 服务器上将 1K pdf 文件转换为 doc。我可以使用 libreoffice 命令行将 PDF 转换为 Word:

libreoffice --headless --invisible --convert-to doc Sample-doc-file-100kb.pdf
Run Code Online (Sandbox Code Playgroud)

或使用办公室:

soffice --nocrashreport --nologo --nolockcheck --nofirststartwizard --invisible --headless --convert-to doc Sample-doc-file-100kb.pdf
Run Code Online (Sandbox Code Playgroud)

上述两个命令的主要问题是 doc 文件在页面中不包含图像,它只包含格式化的文本。有没有更好的方法将 pdf 转换为 doc,包括 pdf 中存在的图像?我对像 zamzam 这样的 Web 服务不感兴趣,我需要从服务器上的命令行执行此操作。谢谢你。

igi*_*nak 3

你可以试试abiword软件。例如:

abiword --to=doc 示例.pdf

  • 已经尝试过,它只转换文本而不转换图像 (2认同)