小编Joh*_*ohn的帖子

多语言搜索索引

我正在建立一个Solr搜索引擎,它将索引多种语言.我创建了一个自定义的UpdateProcessorFactory来确定输入文本的哪些部分是哪种语言,然后我将文档的这些部分复制到特定于语言的字段中.例如,使用此文本:

"Hello World,Bonjour le Monde,Hallo Welt."

它将"Hello World"复制到文本字段中,将"Bonjour le Monde"复制到fr文本字段中,将"Hallo Welt"复制到de-text字段中.每个字段都有相应的语言分析器来标记和限制单词.

最后,我希望有一个框供用户输入可搜索所有语言的搜索词.搜索词不需要翻译,但应适当地删除.完成此任务的最佳方法是什么?我也非常关注搜索的性能.

solr

1
推荐指数
1
解决办法
6312
查看次数

标签 统计

solr ×1