在多个 pdf 和文档中搜索文本

Rab*_*bit 47 text pdf search doc

我收到了一堆其他学生写的笔记,但它们来自一本旧教科书,没有按照相同的顺序处理所有内容,所以我需要搜索每一章的笔记(每个章节都在不同的 . pdf 或 .doc)例如“跟踪调节”。

我曾经为此使用 Google 桌面,我现在有 Launchy,我告诉它搜索 pdf,但它只搜索标题,而不搜索内容。

谢谢你的帮助。

Glu*_*ate 46

Recoll可能是您在 Linux 上可以找到的最通用的文档搜索引擎:

在此处输入图片说明

它支持多种不同的格式,并且非常可定制。

有关安装说明和其他指示,请查看此答案官方文档也非常有用。

  • 接受这个答案,因为它是 linux 原生的,它在 ubuntu 软件中心,而且都是 gui。换句话说,这是最简单的一个 :D 谢谢 :) (5认同)
  • 不要忘记安装 `antiword` 以便搜索 `.doc` 文件。 (2认同)

Edw*_*lds 31

安装包 pdfgrep

sudo apt-get install pdfgrep
Run Code Online (Sandbox Code Playgroud)

然后使用命令:

find /path -iname '*.pdf' -exec pdfgrep pattern {} +
Run Code Online (Sandbox Code Playgroud)

  • 如果您知道您的 PDF 文件在哪里,您可以将命令简化为`pdfgrep -r "my expression"`,其中`-r` 在目录中递归搜索。 (4认同)

lab*_*nut 5

使用DocFetcher,它是一个原生的 Linux 应用程序,可以索引和搜索多种文档类型。