小编Bha*_*r k的帖子

我有一个大型语料库（大约40万个独特的句子）。我只想获取每个单词的TF-IDF分数。我试图通过扫描每个单词并计算频率来计算每个单词的分数，但是它花费的时间太长。

我用了：

  X= tfidfVectorizer(corpus)

来自sklearn，但它直接返回句子的向量表示。有什么方法可以获取语料库中每个单词的TF-IDF分数吗？

0
推荐指数

1
解决办法

2896
查看次数

nlp ×1

小编Bha_r k的帖子