我正在做一个项目,要求我对文档进行排序以匹配主题.
例如,我有4个主题,讲座,导师,实验室和考试.我有一些句子是:
现在我想把这些句子分成上面的主题,结果应该是:
我做了研究,我发现的最多指令是使用LDA主题建模.但似乎无法解决我的问题因为我知道LDA支持识别文档中的主题,并且不知道如何手动预选主题.
有人可以帮帮我吗?我坚持这一点.
python nltk
nltk ×1
python ×1