Lucene和Lucene.Net的俄语分析器

Mis*_*sha 15 .net java lucene

Lucene对俄语的支持很差.

RussianAnalyzer(lucene-contrib的一部分)质量很差.

用于Snowball的RussianStemmer模块更糟糕.它不能识别Unicode字符串中的俄语文本,显然假设必须使用Unicode和KOI8-R的某些奇怪组合.

你知道更好的解决方案吗?

spa*_*iev 5

我的回答可能为时已晚,但郑重声明,我发现AOT 项目中的分析器比 Lucene 附带的分析器要好得多。


squ*_*tte 2

如果其他方法都失败,请使用Sphinx