数据如何存储在lucene中

Ram*_*esh 15 lucene

我知道lucene会创建一个索引并存储所有数据.任何人都可以告诉我数据是如何存储在平面文件中的吗?或者他们使用什么样的算法在后端存储数据,以便他们可以快速检索?

Fel*_*mel 8

不知道这是不是你要的.但更一般的答案是他们使用/实施倒置索引.Lucene如何存储它的具体细节你可以用文件格式找到(正如米兰所说).

但一般的想法是它们存储一个倒置索引数据结构和其他辅助数据结构,以帮助快速回答查询.例如,它存储每个文档的规范向量和每个术语的IDF(逆文档频率).Lucene还存储实际的文档字段,但这不在Inverted Index中.


mil*_*lan 5

您可以在文件格式部分找到所有解释的内容.


nar*_*esh 4

你可以阅读这本书http://nlp.stanford.edu/IR-book/来了解信息检索系统中使用的数据结构、算法和模型

  • 还有另一本很棒的信息检索书籍,现在提供免费内容:https://ciir.cs.umass.edu/irbook/ (2认同)