如何在Solr中配置词干?

use*_*009 7 solr stemming

我添加到索尔索引:"美国".当我搜索"美国"时,没有结果.

如何配置schema.xml以获得结果?

目前的配置:

<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
            <analyzer type="index">
                <tokenizer class="solr.WhitespaceTokenizerFactory" />
                <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" />
                <filter class="solr.LowerCaseFilterFactory" />
                <filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
                <filter class="solr.RemoveDuplicatesTokenFilterFactory" />
                <filter class="solr.PorterStemFilterFactory"/>
            </analyzer>
            <analyzer type="query">
                <tokenizer class="solr.WhitespaceTokenizerFactory" />
                <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
                <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" />
                <filter class="solr.LowerCaseFilterFactory" />
                <filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt" />
                <filter class="solr.RemoveDuplicatesTokenFilterFactory" />
                <filter class="solr.PorterStemFilterFactory"/>
            </analyzer>
        </fieldType>
Run Code Online (Sandbox Code Playgroud)

Mar*_*aci 4

为什么你会有两个词干器?
尝试EnglishPorterFilterFactory从两种分析器类型中删除(已弃用),重建索引,然后尝试搜索American是否会产生America

如果这不起作用,您可以尝试的另一件事是删除两个词干过滤器并SnowballPorterFilterFactory添加language="English"

  • 根据http://snowball.tartarus.org/demo.php,**美国**在被阻止时**保持完好**。 (5认同)
  • 您应该做的第一件事是打开 Solr 管理 Web 应用程序,转到“分析”并选择您的字段类型/名称(检查两个详细输出字段),在“索引”字段中输入“American”,在“查询”字段中输入“America”。这将使您能够看到它是如何被逐个过滤器分析的。如需更详细的分析,请下载 [Luke](http://www.getopt.org/luke/luke-0.9.9/lukeall-0.9.9.jar)(如果您还没有)(它是可执行 jar)。启动它并加载 Lucene 索引。用它来了解您的内容到底是如何被阻止的以及许多其他有用的信息...... (4认同)