将PDF的内容打印到命令行

and*_*kus 6 linux pdf command-line cat

我正在寻找一个命令行程序,它将打印出PDF文件的文本,就像cat文本文件一样.我很确定这样的事情存在,因为我记得几个月前使用它.我本可以发誓pdfcat,但这只是一个合并的实用程序.我发现pdftotxt,这是可行的,但我更喜欢复制cat功能的东西,因为我想管道grep.谢谢!

jsv*_*svk 18

在手册页上pdftotext,我发现了这个:

pdftotext [options] [PDF-file [text-file]]

说明Pdftotext将可移植文档格式(PDF)文件转换为纯文本.

Pdftotext读取PDF文件,PDF文件,并写入文本文件,文本文件.如果未指定text-file,pdftotext会将file.pdf转换为file.txt.如果文本文件为" - ",则将文本发送到stdout.

因此,如果你的目标是输出到stdout以便管道转换为grep,pdftotext mydoc.pdf -那么就应该工作了cat mytext.txt,因此pdftotext mydoc.pdf - | grep mysearchterm