用于linux的CLI pdf viewer

bit*_*ask 57 linux pdf command-line ncurses pdftotext

嘿,现在已经有一段时间了,我正在为命令行寻找一个pdf查看器.

因为我喜欢在Linux上没有X工作,并且经常在远程机器上工作,所以我想有一个工具来阅读pdfs.有很多非常好的图形程序(evince,okular,acroread,...)来完成这项工作,所以我认为应该至少有一个像样的文本模式工具.但我甚至不知道一个糟糕的人!

目前,我要么开始只读取pdf,要么使用pdftohtml + lynx.然而,后者不会产生非常好的输出,并且大多数文档都是不可读的,特别是如果它们包含数学公式.

谷歌有很多人说要么不可能,要么建议使用pdftohtml版本.

我意识到,这不是一个编程问题,但我正在考虑启动一个项目来实现这样的程序,除非已经有一个好的程序.

谢谢你的任何建议.

小智 73

嗨,我认为您不需要为您的目的编写程序我的意思是在控制台模式下读取pdf文件,因为"less"命令已经为您完成了.所以使用它,享受它.

少了"pdf文件的名称"

  • 在某些系统上(在Debian上测试),命令`lesspipe <filename> | 少工作. (24认同)
  • 干净的把戏!在archlinux上我必须安装`lesspipe`才能工作,默认情况下可能会安装其他的distibutions.+1 (10认同)
  • 对于像我这样的人发现这个,并得到错误"没有pdftottext可用"只是'apt-get install pdftohtml`(或yum ...等取决于你的发行版),以使这个工作. (7认同)
  • 不是pdf二进制格式?`less`生成的文本应该是乱码 (4认同)
  • 如果pdftohtml不可用,请使用`sudo apt-get install poppler-utils`. (2认同)

Kur*_*fle 17

好的,你甚至要求知道"蹩脚"的.这里有两个(自己决定各自的疯狂):

第一:Ghostscript的 txtwrite输出设备

 gs \
   -dBATCH \
   -dNOPAUSE \
   -sDEVICE=txtwrite \
   -sOutputFile=- \
   /path/to/your/pdf
Run Code Online (Sandbox Code Playgroud)

第二:XPDF的 pdftotext CLI实用程序(优于Ghostscript):

 pdftotext \
   -f 13 \
   -l 17 \
   -layout \
   -opw supersecret \
   -upw secret \
   -eol unix \
   -nopgbrk \
   /path/to/your/pdf
   - |less
Run Code Online (Sandbox Code Playgroud)

这将显示页面范围13(˚F IRST页)到17( AST页面),保留双密码保护的名为PDF文件的布局(使用用户和所有者密码秘密绝密),对Unix EOL惯例,但不在PDF页面之间插入分页符,通过更少的管道...

pdftotext -h 显示所有可用的命令行选项.

当然,这两种工具仅适用于PDF的文本部分(如果有的话).哦,数学公式也不会太好...... ;-)


编辑:我错误输入了上面的命令(最初使用pdftops而不是pdftotext).

  • Ghostscript 命令效果很好,而且比上面那个说少用的愚蠢答案要好得多。这应该是评分最高的答案。 (2认同)
  • 这里的这个应该是公认的答案.更确切地说,`pdftotext`优雅地完成工作.特别是`-layout`. (2认同)

use*_*424 5

还有绿色的PDF 查看器。YouTube 上有一个演示。


mlw*_*lwn 5

顺便说一句,即时通讯总是处于相同的情况,我使用mc(午夜指挥官)处理文本pdf非常好...只需在mc中查看文件(F3)