Gensim获取文档主题(见文档)

Cen*_*tAu 7 python lda gensim

我知道在为gensim训练lda模型之后,我们可以通过以下方式获得一个看不见的文档的主题:

lda = LdaModel(corpus, num_topics=10)
doc_lda = lda[doc_bow]
Run Code Online (Sandbox Code Playgroud)

但是那些已经用于培训的文件呢?我的意思是有没有办法在培训中使用语料库中的文档,而不像新文档那样对待它?

Rad*_*dim 6

没有.

来自单个文档的信息被提炼到模型中,然后被遗忘.不保留每个文档的信息(更一般地说:不O(#docs)保留需要内存的信息).