Lucene的表现

KP.*_*KP. 6 java lucene performance

你能否就lucene性能应遵循的步骤提出建议.特别是大数据(大约1TB的pdf文件要编入索引)

Yuv*_*l F 8

  1. 阅读Scaling Lucene和Solr.
  2. 从Lucene定义您的需求(例如:您正在索引PDF - 您是否需要存储全文,只是为了使其可搜索,或者根本不存在?)
  3. 进行小规模实验 - 索引一些文档,看看检索是否足够好.
  4. 尝试索引整个事物(考虑到文章的快速索引和索引检索速度的提示) - 检索是否足够好?性能是否足够好?
  5. 重复.


Sha*_*ore 6

请查看优化Lucene性能问题的提示.由于您正在处理大量数据,因此还需要观察索引创建性能.有关提高索引性能搜索性能的一些提示可在Lucene Wiki上找到.