在弹性搜索中获取默认停止词列表

Pau*_*ber 7 documentation search elasticsearch

我试图找出弹性搜索的预定义停用词列表是什么,但我发现没有记录的读取API.

所以,我想找到这个预定义变量的单词列表(_arabic_, _armenian_, _basque_, _brazilian_, _bulgarian_, _catalan_, _czech_, _danish_, _dutch_, _english_, _finnish_, _french_, _galician_, _german_, _greek_, _hindi_, _hungarian_, _indonesian_, _irish_, _italian_, _latvian_, _norwegian_, _persian_, _portuguese_, _romanian_, _russian_, _sorani_, _spanish_, _swedish_, _thai_, _turkish_)

我在文档中找到了英文停用词列表,但我想检查它是否是我的服务器真正使用的那个,并检查其他语言的停用词列表.

Val*_*Val 13

英语分析器使用的停用词与标准分析器中定义的停用词相同,即您在文档中找到的停用词.

可以在analysis/common/src/resources/org/apache/lucene/analysis文件夹中的Lucene存储库中找到所有其他语言的停用词文件.