Wat*_*att 12 lucene algorithm nlp information-retrieval
我理解倒排索引的概念以及字典存储优化如何帮助在主存中加载整个字典以便更快地查询.
我试图了解Lucene索引是如何工作的.
假设我有一个String类型字段,对于Lucene中索引的2000亿个文档只有四个不同的值.该字段是存储字段.
如果我将字段更改为Byte或Int类型以表示所有4个不同的值,并重新索引并存储所有2000亿个文档.
此数据类型更改的存储和查询优化是什么?如果有的话.
请建议我是否可以在笔记本电脑上进行一些测试以获得理解.