Solr中的确切单词搜索

Rut*_*uth 2 lucene search solr stemming

我有一个与这个问题密切相关的问题.

在我的架构中,我有一个字段

<field name="text" type="textgen" indexed="true" stored="true" required="true"/>
Run Code Online (Sandbox Code Playgroud)

这给出了完全匹配,即.阻止残疾

吃=吃

是否有可能,虽然配置为textgen搜索该单词的其他变体

例如.吃=吃,吃,吃

吃〜0会给出类似的声音,如肉,节拍等,但这不是我想要的.

我开始认为实现这一目标的唯一方法是添加另一个字段,然后使用textgen,但如果有更简单的方法,我很有兴趣听到它.

Joh*_*erg 6

使用copyfield语句是Solr中的常规方法.既然stemming答案正是您所要求的,那么我建议您使用.stored=false如果您担心索引大小,可以设置.

您也可以使用lemmatisation,这与词干相反 - 您可以在其中添加所有变形形式的单词.这通常在搜索查询上执行,例如扩展eateat, eats, eating等等.

第三种选择可能是使用通配符搜索,但我不鼓励它.尤其是因为它绕过了目标字段的所有模式配置过滤器.