Oli*_*s_j 5 text machine-learning social-networking
我想对文本进行情感分类(来自社交媒体的帖子,例如推文,facebook墙贴,youtube评论等......).虽然我找不到带有注释数据的好数据集.我正在寻找的不只是带有正面和负面注释的数据.我正在寻找一个有几种情绪的数据集.这可以是或离散值(ekman 6基本情绪)或持续值(唤醒 - 效价模型).有谁知道我可以在哪里获得这样的数据集,这可以来自Twitter,Facebook,Myspace ......只要它来自社交网络
好吧,我认为更好的名称(或更常用)是情感分析(情感分类)-正确吗?我不确定社交媒体是否提供他们的私人数据(也许是其中的一部分)。无论如何,我找到了这篇论文:
http://www.cs.cornell.edu/home/llee/papers/sentiment.pdf
他们正在处理数据:http://www.cs.cornell.edu/people/pabo/movie-review-data/来自https://groups.google.com/forum/?fromgroups#!aboutgroup/rec.arts .电影.评论.
它适合你吗?基本上,寻找合适的数据通常是机器学习中的一个大问题。通常需要构建自己的(我的意思是手动对其中一部分进行分类,然后应用一些聚类或半监督学习)
如果您在网络上找不到任何合适的内容,我会尝试联系一些撰写与您的研究类似的文章的作者。也许他们已经创建了适合您的数据集......