命令行友好的全文索引?

jul*_*ien 44 command-line search

是否有全文索引引擎之类的东西,可以从命令行查询,理想情况下根本不需要使用 gui?

我对索引我的电子书和论文特别感兴趣,所以这是 pdf、epub 和一些 djvu 的混合。(Open)Office 文档会很好,但在我的列表中要低得多。

gab*_*be. 12

你看过 Lucene 或 Sphinx 吗?虽然您首先需要解析您想要索引的文档,但一旦完成,任何一个都可以从 cli 中进行搜索。

对于 Lucene,有一些关于执行此操作的信息可用

Sphinx,有点模糊,但也有一些可用的文档。您可以通过 xmlpipe2 数据源将您选择的结构化 XML 数据传递给 sphinx。

Lucene 依赖于 Java,而 Sphinx 是用 C++ 构建的,不需要外部依赖。

任何一个都需要做一些工作来做你想做的事,但是,似乎是一个完全可行的解决方案。


Mic*_*jer 6

查看xapian。它有命令行界面,可以索引很多格式。


小智 5

Recoll可以在没有 GUI 的情况下构建,并将从命令行搜索您的文档类型。

它在引擎盖下使用Xapian


joe*_*dle 5

这个答案建议使用谷歌的codesearch

代码搜索是一种用于索引然后对大量源代码执行正则表达式搜索的工具。

Debian/衍生品的超级用户可以尝试:sudo apt-get install codesearch


Mac*_*tka 4

Tracker 可以从命令行调用,并且 gtk+ 不是项目的硬依赖项(但可能是包的硬依赖项)。