Mar*_*sch 8 solr analysis elasticsearch
Solr具有内置的"分析屏幕",有助于调试特定字段类型的标记器和过滤器之间的相互作用:

是否有一个ElasticSearch插件可以做类似的事情?具体来说,我希望看到每个过滤器的输入/输出,而不仅仅是分析链的最终结果.我在这方面非常密集地使用谷歌,但没有找到任何东西.
https://www.found.no/play/#analysis完全包含我想要的功能(向下滚动到"myAnalyzer"),但不幸的是,这不是我可以在我的索引上运行的东西.但它表明这样的功能是可能的.
编辑:我知道有很多插件显示完整的过滤器链的输出,例如用户@Bass建议的kopf:

这不是我想要的!我想看看每个过滤器的输出,而不仅仅是最终结果.
有一个名为elyzer的独立工具,由 OpenSource Connections 的好心人开发。该工具将向您显示分析过程中任何步骤(字符过滤器、标记生成器、标记过滤器)的标记状态,并且使用起来非常简单。
安装它非常简单pip install elyzer,然后您可以将它用作命令行工具,例如
$ elyzer --es "http://localhost:9200" --index tmdb --analyzer english_bigrams --text "Mary had a little lamb"
TOKENIZER: standard
{1:Mary} {2:had} {3:a} {4:little} {5:lamb}
TOKEN_FILTER: standard
{1:Mary} {2:had} {3:a} {4:little} {5:lamb}
TOKEN_FILTER: lowercase
{1:mary} {2:had} {3:a} {4:little} {5:lamb}
TOKEN_FILTER: porter_stem
{1:mari} {2:had} {3:a} {4:littl} {5:lamb}
TOKEN_FILTER: bigram_filter
{1:mari had} {2:had a} {3:a littl} {4:littl lamb}
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
410 次 |
| 最近记录: |