msm*_*msm 2 python text-processing stanford-nlp python-2.7 python-3.x
How can I get lemmas for Arabic words? I tried the ISRI Arabic Stemmer from NLTK but it returns roots of words:
from nltk.stem.isri import ISRIStemmer
st = ISRIStemmer()
print st.stem(u'????????')
Run Code Online (Sandbox Code Playgroud)
It returns the root ??? and i want the lemma ??????
最先进的是Farasa Lemmatizer。
Farasa Lemmatizer 基于准确性优于 MADAMIRA Lemmatizer。它在词形还原任务中比 MADAMIRA 提供了 +7% 的准确度相对增益。
您可以从以下链接阅读有关 Farasa Lemmatizer 的更多信息:https ://arxiv.org/pdf/1710.06700.pdf
| 归档时间: |
|
| 查看次数: |
2967 次 |
| 最近记录: |