情况:
我有一个numpy term-document矩阵示例:[[0,1,0,0 ....],.... [...... 0,0,0,0]].
我已将上述矩阵插入到gensim的ldamodel方法中.使用lad方法可以正常工作lda = LdaModel(corpus, num_topics=10).
corpus是我上面提到的术语 - 文档矩阵.我需要两个中间矩阵(主题词阵列和文档主题数组)用于研究目的.
1)每个文档主题概率矩阵(p_d_t)
2)每个主题 - 词概率矩阵(p_w_t)
题:
如何从gensim LdaModel()函数中获取这些数组.请帮助我获取这些矩阵.
sin*_*wav 10
1.Per-document主题概率矩阵:
将转换应用于您的语料库.
docTopicProbMat = lda[corpus]
Run Code Online (Sandbox Code Playgroud)
K = lda.num_topics
topicWordProbMat = lda.print_topics(K)
| 归档时间: |
|
| 查看次数: |
4873 次 |
| 最近记录: |