我正在建立一个Solr搜索引擎,它将索引多种语言.我创建了一个自定义的UpdateProcessorFactory来确定输入文本的哪些部分是哪种语言,然后我将文档的这些部分复制到特定于语言的字段中.例如,使用此文本:
"Hello World,Bonjour le Monde,Hallo Welt."
它将"Hello World"复制到文本字段中,将"Bonjour le Monde"复制到fr文本字段中,将"Hallo Welt"复制到de-text字段中.每个字段都有相应的语言分析器来标记和限制单词.
最后,我希望有一个框供用户输入可搜索所有语言的搜索词.搜索词不需要翻译,但应适当地删除.完成此任务的最佳方法是什么?我也非常关注搜索的性能.
solr ×1