NLTK是否实施了TF-IDF?

alv*_*vas 8 python nlp nltk tf-idf

scikit-learn和中有TF-IDF实现gensim.

有简单的实现在Python中简单实现N-Gram,tf-idf和余弦相似性

为了避免重新发明轮子,

  • 在NLTK中真的没有TF-IDF吗?
  • 是否存在我们可以操作以在NLTK中实现TF-IDF的子包?如果有怎么样?

在这篇博文中,它说NLTK没有它.真的吗? http://www.bogotobogo.com/python/NLTK/tf_idf_with_scikit-learn_NLTK.php

yve*_*man 9

NLTK TextCollection类有一个计算术语的tf-idf的方法.文档在这里,源代码在这里.但是,它说"加载速度可能很慢",因此使用scikit-learn可能更为可取.