Zac*_*ach 4 python nlp nltk wordnet semantic-analysis
如何使用WordNet确定python中两个文本之间的语义相似度?
明显的预处理将是删除停止词和词干,但那又是什么?
我能想到的唯一方法是计算两个文本中每个单词之间的WordNet路径距离.这是unigrams的标准.但这些是大型(400字)文本,即自然语言文档,其中的单词不具有任何特定顺序或结构(除英语语法强加的单词外).那么,你会在文本之间比较哪些词?你会如何在python中做到这一点?
| 归档时间: |
|
| 查看次数: |
5909 次 |
| 最近记录: |