高效的Lemmatizer,避免字典查找

ame*_*til 7 java text-analysis relevance lemmatization

我想把像'吃'这样的字符串转换成'吃','吃'.我搜索并发现了词形还原作为解决方案,但我遇到的所有lemmatizer工具都使用wordlist或字典查找.是否存在避免字典查找并提供高效率的词形变换器,可能是基于规则的词形变换器.是的,我不是在寻找"干扰者".

Mit*_*ran 1

您可以尝试LRBL:基于规则的词形还原器

它使用递归首字母缩略词的概念。