相关疑难解决方法(0)

如何在scikit-learn中查看tfidf之后的term-document矩阵的前n个条目

我是scikit-learn的新手,我TfidfVectorizer用来在一组文档中找到术语的tfidf值.我用下面的代码来获得相同的代码.

vectorizer = TfidfVectorizer(stop_words=u'english',ngram_range=(1,5),lowercase=True)
X = vectorizer.fit_transform(lectures)
Run Code Online (Sandbox Code Playgroud)

现在如果我打印X,我能够看到矩阵中的所有条目,但我如何根据tfidf分数找到前n个条目.除此之外,是否有任何方法可以帮助我找到基于每个ngram的tfidf得分的前n个条目,即unigram,bigram,trigram等中的顶级条目?

python numpy tf-idf top-n scikit-learn

37
推荐指数
1
解决办法
2万
查看次数

标签 统计

numpy ×1

python ×1

scikit-learn ×1

tf-idf ×1

top-n ×1