我们计划部署Solr来搜索从通用CMS平台发布的多个站点.
每种语言将有单独的网站,其他语言将主要从英语翻译内容.
搜索要求包括 - 关键字突出显示,建议("你的意思是?"),停用词,分面.
我们正在评估使用单核与每种语言的多核Solr选项.这里推荐的方法是什么?
您需要多核,因为您无法在多语言数据库中执行词干和停用词.
英语中的常用词是"by"和"is",但这些词在许多北欧语言中意为"城镇"和"冰".
如果你做多核,每种语言都可以在自己的核心上使用自定义的schema.xml来选择正确的词干分析器,停用词和受保护的单词.但是同一个JVM在同一台服务器上运行它,所以你不会为一种特定语言的服务器花费任何额外的钱.然后,如果一个服务器的负载太大,则复制多核设置,所有索引都从副本中受益.
| 归档时间: |
|
| 查看次数: |
1848 次 |
| 最近记录: |