cjm*_*671 5 tagging machine-learning svm
我有一个包含数十万个论坛帖子的数据库,并且希望以一种不受监督的方式对其进行标记。
我注意到StackOverflow的标签系统会在我使用时建议标签。该算法如何工作?
我还发现这意味着它基于SVM,是官方的吗?http://dl.acm.org/citation.cfm?id=2660970&dl=ACM&coll=DL&CFID=522960920&CFTOKEN=15091676
Man*_*Kar 0
您还可以使用 Gensim 和词嵌入进行浅层(作者称之为深度)逆回归进行文档分类。理想情况下,使用论坛帖子的标题和文本,您应该能够构建一个相当不错的分类系统。请按照本笔记本和纸张进行操作。
归档时间:
10 年,4 月 前
查看次数:
117 次
最近记录:
8 年,9 月 前