elasticsearch定制令牌生成器-按长度拆分令牌

ybe*_*hon 5 lucene tokenize analyzer stringtokenizer elasticsearch

我正在使用Elasticsearch版本1.2.1。我有一个用例,其中我想创建一个自定义令牌生成器,该令牌生成器将令牌的长度破坏到一定的最小长度。例如,假设最小长度为4,则令牌“ abcdefghij”将被拆分为:“ abcd efgh ij”。

我想知道是否可以在无需编写自定义Lucene Tokenizer类的情况下实现此逻辑?

提前致谢。

bit*_*kar 3

根据您的要求,如果您无法使用模式标记生成器来完成此操作,那么您需要自己编写一个自定义 Lucene 标记生成器类。您可以为其创建自定义 Elasticsearch 插件。您可以参考示例,了解如何为自定义分析器创建 Elasticsearch 插件。