在 Ubuntu 上索引 PDF 文件

puf*_*ish 5 ubuntu pdf indexing

我正在 Ubuntu 中寻找一种解决方案,该解决方案可以为 PDF(和 ps?)文件编制索引以供以后搜索。

标准是:

  1. 兼容性:通常提取文本会有所不同,具体取决于用于创建 PDF 的软件。某些 PDF 也可以“锁定”,我想人们应该尊重这一点。
  2. 搜索功能:通配符、正则表达式、“模糊”匹配。
  3. 搜索速度

在我的情况下,我想索引学术期刊文章的文件夹,因此要求无论使用什么软件创建 PDF,它都能始终如一地工作。我已经在使用参考管理器,所以不想替换它。

例如:一个好的 Beagle 前端,以及一个允许它索引 PDF 的插件将是完美的。

wzz*_*zrd 2

Tracker 的功能与 Beagle 和 Strigi 相同,但与 Beagle 不同的是,它是用纯 C 编写的(Beagle 是 Mono 应用程序)。据称,它比 Beagle 快很多,尽管我自己没有计算过。

我找不到 Tracker 的链接,但我确信它位于默认的 Ubuntu 存储库中。