有没有办法使用 grep 搜索 PDF 文件,而无需先在 Ubuntu 中转换为文本?
我刚刚了解到可以压缩 PDF 文件以减少其磁盘大小。
我的环境是 Linux Ubuntu 10.10。
一些尝试没有给出令人满意的结果:
以下是尝试的结果pdftk
:
$ pdftk 3.pdf output 5.pdf uncompress
$ pdftk 3.pdf output 3comp.pdf compress
$ ls -l 3.pdf 3comp.pdf 5.pdf
-rwxrwx--- 1 root plugdev 8652269 2011-07-30 12:27 3comp.pdf
-rwxrwx--- 1 root plugdev 8652319 2011-07-29 22:15 3.pdf
-rwxrwx--- 1 root plugdev 16829828 2011-07-30 12:27 5.pdf
Run Code Online (Sandbox Code Playgroud)
文件的属性表明它们都没有优化。
转换为 ps 然后返回 pdf 的结果:
$ pdf2ps 3.pdf 3.ps
$ ps2pdf 3.ps 3c.pdf
$ ls -l 3.pdf 3.ps 3c.pdf
-rwxrwx--- …
Run Code Online (Sandbox Code Playgroud)