主题发现/发现的最佳模型

3 nlp information-retrieval keyword information-extraction topic-modeling

什么是短期非结构化文档中主题定位的最佳模型,例如.短信或Twitter消息?潜在的Dirichlet分配?

Fre*_*Foo 5

LDA是可用于主题建模的最强模型之一,但将其应用于Twitter /微博帖子等非常短的文本可能需要一些额外的工作.的作者本文讨论LDA和替代模型,并推荐在其上运行一个主题模型前聚集多个职位.

[注意术语:"主题发现"实际上是监督文档分类的旧同义词.]