如何使用槌获得单词主题概率

use*_*547 4 java mallet

我使用mallet创建了一个并行主题模型.

我想为每个文档获得顶级单词.

为此,我试图获得一个单词主题概率矩阵.

我怎么做到这一点?

小智 8

使用mallet构建主题时,您有一个名为"--word-topic-counts-file"的选项.当您提供此选项并指定文件时,mallet会为文件中的每一行写入(主题,单词,概率)值.您可以稍后用C,Java或R(当然,任何语言)读取此文件以创建所需的矩阵.