关键字搜索引擎,返回统计信息而非命中

Mik*_*ike 5 sql database lucene indexing search

关于StackOverflow的第一篇文章,但我一直把这个网站视为共享知识的重要来源,我很高兴看到这个问题的结果.

我觉得我现在已经达到了SQL索引,统计和全文搜索的极限,我正在寻找一个可以为我们提供所需功能的搜索库.我不反对自己编写(如果我能得到老板的批准,也可以开源),但我更愿意找到一些已经存在的开源软件,natch.

我们所追求的是一个搜索引擎,可以提供有关用户搜索特定关键字时匹配的结果的统计信息.比方说,我们说的是我们在谈论在线商店的产品数据库.我们需要能够返回有关统计有多少产品有相匹配的一组给定的关键字(也可以过滤这个结果按价格,类别等设置),以及产品在股票总数(假设它存储在product表的字段中).我找到的所有搜索引擎都返回前n个结果,如果你想要统计结果集的大小,你需要枚举整个集合.即使你没有,你仍然需要这样做来检索库存产品的总数.

有没有人知道这个功能是什么?就像我说的那样,我很高兴自己动手,或者自己构建它,或修改像Lucene这样的功能,但是我无法在Google上找到任何合适的东西.

先谢谢你们!

Xod*_*rap 1

这里要记住的是,“枚举所有结果”可能意味着非常不同的事情 -select count(*)与实际获取每个对象所需的所有连接等非常不同。Lucene 和关系数据库都是如此。因此,我不会担心文档中所说的“我们枚举所有结果”这一事实。

根据我的经验,Solr 的标准方面可以满足 99% 的人的需求。如果您属于那 1%(即您拥有庞大的数据库),那么我可以建议一些更快的猜测结果的方法。但 Solr 可能会为你工作。