单核或多核Solr

Sol*_*olr 4 multilingual solr

我们计划部署Solr来搜索从通用CMS平台发布的多个站点.

每种语言将有单独的网站,其他语言将主要从英语翻译内容.

搜索要求包括 - 关键字突出显示,建议("你的意思是?"),停用词,分面.

我们正在评估使用单核与每种语言的多核Solr选项.这里推荐的方法是什么?

Mic*_*lon 6

您需要多核,因为您无法在多语言数据库中执行词干和停用词.

英语中的常用词是"by"和"is",但这些词在许多北欧语言中意为"城镇"和"冰".

如果你做多核,每种语言都可以在自己的核心上使用自定义的schema.xml来选择正确的词干分析器,停用词和受保护的单词.但是同一个JVM在同一台服务器上运行它,所以你不会为一种特定语言的服务器花费任何额外的钱.然后,如果一个服务器的负载太大,则复制多核设置,所有索引都从副本中受益.