我正在尝试在网站上进行良好的自然语言搜索,并试图了解Apache Solr与Xapian的优势.Xapian似乎更容易设置.两者都提供良好的自然语言搜索?有任何见解赞赏.
Xapian更像是Lucene,一个与应用程序集成的库.如果你有一个C++应用程序,那么Xapian可能是一个更好的匹配.如果您有Java应用程序,Lucene几乎肯定是最佳选择.
如果你想要一个搜索服务器,那么将Omega(基于Xapian构建)与Solr(基于Lucene构建)进行比较.我没有使用Omega或Xapian,但Solr有一些我依赖的功能,尤其是每场分析链.这是一个绝妙的主意,也是我希望在Ultraseek工作时想到的.
使用您自己的Java类扩展Solr分析链非常容易.我希望在使用Omega/Xapian的C++中会更难.
这两个引擎使用不同的基础相关模型.Xapian是一个概率引擎,Lucene是一个矢量空间引擎.我已经看到两种型号都能很好地运行,所以这可能不是决定的理由.
Solr/Lucene社区规模庞大且非常有帮助.