gensim 中的词汇量远低于训练数据中的词汇量

use*_*804 5 gensim word2vec

我正在使用 Gensim 训练大小为 4 的句子,我在训练数据集中有 1192 个唯一单词。模型 len(model.vocab) 中的单词数是 141,但这没有意义。有什么理由看到这个吗?我如何改变他们的模型,让训练中的每个单词都有一个键?模型 = Word2Vec(windows,min_count=1)