Mis*_*sha 15 .net java lucene
Lucene对俄语的支持很差.
RussianAnalyzer(lucene-contrib的一部分)质量很差.
用于Snowball的RussianStemmer模块更糟糕.它不能识别Unicode字符串中的俄语文本,显然假设必须使用Unicode和KOI8-R的某些奇怪组合.
你知道更好的解决方案吗?
spa*_*iev 5
我的回答可能为时已晚,但郑重声明,我发现AOT 项目中的分析器比 Lucene 附带的分析器要好得多。
squ*_*tte 2
如果其他方法都失败,请使用Sphinx
归档时间:
16 年,11 月 前
查看次数:
4360 次
最近记录:
10 年,5 月 前