use*_*128 5 lda topic-modeling
我想了解Latent Dirichlet Allocation(LDA).我有机器学习和概率理论的基本知识,并基于这篇博客文章http://goo.gl/ccPvE我能够发展LDA背后的直觉.但是,我仍然没有完全理解其中的各种计算.我想知道有人可以使用一个非常小的语料库向我展示计算(比如说3-5个句子和2-3个主题).
Edwin Chen(在Twitter btw工作)在他的博客中有一个例子.5个句子,2个主题:
然后他做了一些"计算"
并猜测主题:
你的问题是他是如何提出这些数字的?这些句子中哪些词带有"信息":
现在让我们一句一句地从每个主题中获取单词:
所以我的数字与陈的略有不同.也许他在"西兰花片"中加入了"片"这个词来计算食物.
我们在头脑中做了两个计算:
| 归档时间: |
|
| 查看次数: |
4673 次 |
| 最近记录: |