此功能称为词干分析器:一种可以从任何形式的词中推导出词干的算法.
这可能相当复杂:例如,俄语单词???和???同一动词的不同形式,虽然它们没有一个共同的字母(具有讽刺意味的是,英语也是如此:went和go).
对于在单词之间不使用空格的某些语言来说,分词也是一项非常复杂的任务.
SQL Server 允许使用可插拔的词干分析器和断字器作为其全文搜索引擎:
http://msdn.microsoft.com/en-us/library/ms142509.aspx
| 归档时间: |
|
| 查看次数: |
1217 次 |
| 最近记录: |