将扫描的 pdf 转换为带有二进制(2 级)图像的压缩 PDF

Abh*_*and 2 windows linux compression pdf

我有很多旧的扫描 PDF,它们占用了太多磁盘空间。

我已经尝试了许多网上可用的 PDF 压缩器。他们都问我对彩色图像使用什么压缩,对单色图像使用什么压缩;但我找不到任何东西可以将所有内容转换为二进制图像。

通过二进制,我的意思是每个像素只能具有 2 个颜色值之一:全黑或全白。我知道我所有的 PDF 都有黑/白文本(甚至没有灰度)。某些工具(windows 或 linux 或 android)可以使用这些知识来实现​​更好的压缩吗?

我不确定,但 Adob​​e Acrobat Pro 中的“优化 PDF”工具可能会做我想要的。但是,即使是这样,我也更愿意了解更便宜且更紧凑的应用程序。

Din*_*ngo 5

jbig2 压缩是减少文件大小的最佳方法

Adam Langley 最初为 googlebooks 编写了 jbig2enc 编码器

然后发布源代码以便任何人都可以构建

当然,您也可以使用以下预编译的二进制文件:

Jbig2enc+ akrykukov 补丁

jbig2enc 的通用语法是(假设您的文件是 tiff)

jbig2 -s -p -v *.tiff && pdf.py output >out.pdf
Run Code Online (Sandbox Code Playgroud)

但是,对于Jbig2enc+ akrykukov 补丁

jbig2 -s -p -v -P (number of pages for dictionary) *.tiff && thessalonica-pdf.py *.jbig2 >out.pdf
Run Code Online (Sandbox Code Playgroud)

重要的:

您需要 python 库才能将所有 jbig2 结果文件收集并放在 pdf 中