StackOverflow的标签建议如何工作?

cjm*_*671 5 tagging machine-learning svm

我有一个包含数十万个论坛帖子的数据库,并且希望以一种不受监督的方式对其进行标记。

我注意到StackOverflow的标签系统会在我使用时建议标签。该算法如何工作?

我还发现这意味着它基于SVM,是官方的吗?http://dl.acm.org/citation.cfm?id=2660970&dl=ACM&coll=DL&CFID=522960920&CFTOKEN=15091676

Man*_*Kar 0

您还可以使用 Gensim 和词嵌入进行浅层(作者称之为深度)逆回归进行文档分类。理想情况下,使用论坛帖子的标题和文本,您应该能够构建一个相当不错的分类系统。请按照本笔记本纸张进行操作。