Raj*_*oel 5 lucene search solr full-text-search
我有一个大约有 10 亿条记录的 Solr 索引。每条记录有两个字段——姓名和地址。
对于名称字段,我使用 Beider Morse 过滤器进行语音学。我也有(将创建)好的同义词(如班加罗尔和班加罗尔)和停用词(如村镇城市先生等)列表。我也对我在这两个领域使用的标记器感到满意。
我无法创建仅提供良好匹配结果的查询。有人可以为我提供有用的建议吗?
基本上,我想区分给定名称和地址的不匹配、可能匹配和完全匹配。尽管这是一个非常主观的话题,因为这三种类型之间的界限很窄。
由于 Solr 分数是相对的,因此完全不建议根据分数设置截止边界。如果不是这个,我还能做什么?
来自我的一个相关问题,其中提到了我正在尝试做的一部分 -如何形成具有多个字段和不同字段的不同最小匹配和提升的 Solr edismax 查询?