使用Gensim获得TF-IDF的单词分数

use*_*188 7 python tf-idf gensim

我试图根据他们的TF-IDF分数在语料库中找到最重要的单词.

按照https://radimrehurek.com/gensim/tut2.html上的示例进行操作.基于

>>> for doc in corpus_tfidf:
...     print(doc)
Run Code Online (Sandbox Code Playgroud)

TF-IDF得分在每次迭代中都会得到更新.例如,

所以这就是我目前如何获得每个单词的最终TF-IDF分数,

tfidf = gensim.models.tfidfmodel.TfidfModel(corpus)
corpus_tfidf = tfidf[corpus]
d = {}
for doc in corpus_tfidf:
    for id, value in doc:
        word = dictionary.get(id)
        d[word] = value
Run Code Online (Sandbox Code Playgroud)

有没有更好的办法?

提前致谢.

sat*_*vic 5

如何使用字典理解?

d = {dictionary.get(id): value for doc in corpus_tfidf for id, value in doc}
Run Code Online (Sandbox Code Playgroud)