Oli*_*ver 2 c# lucene lucene.net
是否有可能设置一个最低分数,以便在Lucene中返回结果?
我有这个功能:
public Tuple<int,ICollection<Guid>> Search(string searchQuery,int maxResults)
{
var booleanQuery = new BooleanQuery();
var s1 = new TermQuery(new Term("companyName", searchQuery));
booleanQuery.Add(s1, Occur.SHOULD);
using (var searcher = new IndexSearcher(this.Directory))
{
TopDocs hits = searcher.Search(booleanQuery, maxResults);
var ids = new List<Guid>();
for (int i = 0; i < hits.ScoreDocs.Count(); i++)
{
var idString = searcher.Doc(hits.ScoreDocs[i].Doc).Get("id");
ids.Add(new Guid(idString));
}
return new Tuple<int, ICollection<Guid>>(hits.TotalHits, ids);
}
}
Run Code Online (Sandbox Code Playgroud)
该功能搜索我的索引并返回与searchQuery匹配的公司的ID,以及匹配搜索的公司总数 - 因此我可以写'显示245个匹配公司中的1-20个'.
我的问题是匹配的门槛非常低.如果用户输入"会计",则搜索返回有意义的结果,但如果他们输入"adasdfsdf",则返回不相关的结果.如果结果不够充分,我宁愿显示"抱歉,没有公司符合您的查询"这样的消息.
是否可以为比赛设定最低分数?该TopDocs.TotalHits物业会尊重这个分数吗?
简而言之,没有.你无法真正在Lucene创造一个最低分数截止点.以下是为什么不进行讨论.请注意所讨论的案例与您的要求有所不同,但困难大致相同(事实上,提供一个合理的截止点用于不同的,独立的查询会引入更多,尽管密切相关,困难).
解决这个问题的更好方法是设计您的查询,这样您就不会得到无关的结果.在你的例子中,我真的不明白为什么你会看到很多不相关的结果出现,所以我假设还有其他术语被添加到查询中.在这种情况下,如果您只想获得new Term("companyName", searchQuery)匹配的文档,则应使用Occur.MUSTbooleanClause 添加它,如:
var booleanQuery = new BooleanQuery();
var s1 = new TermQuery(new Term("companyName", searchQuery));
booleanQuery.Add(s1, Occur.MUST);
Run Code Online (Sandbox Code Playgroud)
为了进一步解释,在Occur.MUST和Occur.SHOULD是你的问题在那里.如果你有一个像这样的查询:
category:type1 companyName:asdfdas
Run Code Online (Sandbox Code Playgroud)
并且在companyName上没有结果,那么您只会看到查询的结果category:type1.如果你确实在companyName上匹配,那么这些结果将被判断为具有更高的相关性,并且将首先显示,但它仍然会显示与该类别匹配的所有内容,只是在列表中较低.在该示例中,两个术语都添加了BooleanClause.Occur.SHOULD,因此两者都是可选的(尽管在任何结果中仍然必须找到至少一个匹配术语).
如果您希望仅显示与类别和companyName匹配的条款,则应使用以下内容在查询中同时生成这两个条款BooleanClause.Occur.MUST.使用查询语法,这将看起来像:
+category:type1 +companyName:asdfdas
Run Code Online (Sandbox Code Playgroud)
或者构建一个BooleanQuery:
var s1 = new TermQuery(new Term("companyName", "asdfdas"));
booleanQuery.Add(s1, Occur.MUST);
var s1 = new TermQuery(new Term("category", "type1"));
booleanQuery.Add(s1, Occur.MUST);
Run Code Online (Sandbox Code Playgroud)