PDF智能文件差异

H2O*_*aCl 9 pdf libreoffice

我有一个 LibreOffice 文档,我在某个时间点使用内置功能将其转换为 PDF。PDF 上的时间戳比文字处理文档晚,所以这是有道理的,但我不能绝对确定文字处理文档生成的正是那个 PDF。该文档有 20 页长,因此手动检查它不是一个好主意。

一种可能性是在不同的文件夹中重做 PDF,然后对两个 PDF 进行二进制差异。不幸的是,命令行diff指示“二进制文件不同”。

是否有一个“智能二进制差异”可以帮助我确定差异是否仅存在于元数据中或某些此类无关紧要的差异中?

Rin*_*ind 13

通常,检查命令 + 文件扩展名是否是您要查找的内容是个好主意。diff+pdf 结果为diffpdf

sudo apt-get install diffpdf
Run Code Online (Sandbox Code Playgroud)

DiffPDF 用于比较两个 PDF 文件。默认情况下,比较每对页面上的文本,但也支持比较页面的外观(例如,如果更改图表或重新格式化段落)。还可以比较特定页面或页面范围。例如,如果 PDF 文件有两个版本,一个是第 1-12 页,另一个是第 1-13 页,因为添加了额外的页面作为第 4 页,可以通过指定两个页面范围来比较它们,1第一个是-12,第二个是1-3、5-13。这将使 DiffPDF 将 (1, 1), (2, 2), (3, 3), (4, 5), (5, 6) 等对中的页面与 (12, 13) 进行比较。

在此处输入图片说明

来源:Ubuntugeek.com