如何使用 pandoc 将 pdf 转换为 asciidoc?

my-*_*ord 4 pdf asciidoc pandoc

我正在尝试将 pdf 书转换为 asciidoc 文档。我尝试了以下命令:

pandoc -s s.pdf -t asciidoc -o example28.txt
Run Code Online (Sandbox Code Playgroud)

我遇到了“未知读者”问题。

q@q-ABRA-A5-V12-1:~/Downloads$ pandoc -s s.pdf -t asciidoc -o example28.txt
pandoc: Unknown reader: pdf
Pandoc can convert to PDF, but not from PDF.
Run Code Online (Sandbox Code Playgroud)

我该如何解决这个问题,或者是否有另一种方法可以将 pdf 转换为 asciidoc?

小智 5

你试过pdf2txt吗? https://pypi.org/project/pdfminer/ 这是那里提供的工具之一。

  • 似乎转到 HTML,然后您可以使用 pandoc 从 HTML 转到 asciidoc:`pdf2txt.py -t html input.pdf | pandoc -f html -t asciidoc` (6认同)