我如何估计Lucene指数的大小?

bpa*_*apa 8 lucene

是否有一个已知的数学公式可用于估计新Lucene指数的大小?我知道我想要索引多少个字段,以及每个字段的大小.而且,我知道将索引多少项目.那么,一旦这些由Lucene处理,它如何转换成字节?

Yuv*_*l F 2

这是lucene 索引格式文档。主要文件是复合索引(.cfs 文件)。如果您有术语统计信息,您可能可以获得 .cfs 文件大小的估计值,请注意,这根据您使用的分析器以及您定义的字段类型而有很大差异。