fra*_*ous 30
你有很多选择!
pdftotext
来自poppler已经被提及。
有一个名为 Haskell 的程序pdf2line
运行良好。
calibre的ebook-convert
命令行程序(或 calibre 本身)是另一种选择;它可以将 PDF 转换为纯文本或其他电子书格式(RTF、ePub),在我看来它比 pdftotext 产生更好的结果,尽管它要慢得多。
ebook-convert file.pdf file.txt
AbiWord可以在它从命令行知道的任何格式之间进行转换,并且至少可以选择有一个 PDF 导入插件:
abiword --to=txt file.pdf
另一个选项podofotextextract
来自podofo PDF 工具库。我还没有真正尝试过。
如果您将两个 Ghostscript 工具pdf2ps
和结合起来ps2ascii
,您还有另一个选择。
我实际上可以想到更多的方法,但我现在就离开它。;)