用于文本中情绪检测的数据集

ekk*_*kka 23 database nlp dataset text-mining emotion

我正在实施一个能够检测文本中人类情感的系统.是否有任何手动注释的数据集可用于监督学习和测试?

以下是一些有趣的数据集:https: //dataturks.com/projects/trending

bue*_*hel 38

文本情感检测领域仍然很新,文献在不同领域的许多不同期刊中都是分散的.很难看到那里有什么好看的.

请注意,有几种情绪理论心理学.因此,在计算中有不同的建模/表示情绪的方式.大多数时候,"情绪"指的是诸如愤怒,恐惧或快乐之类的现象.其他理论认为所有情绪都可以在多维空间中表现(因此存在无数个情感).

以下是我知道(更新)的一些(公开)数据集:

  1. EmoBank.用Valence,Arousal和Dominance值注释的10k句子(披露:我是其中一位作者).https://github.com/JULIELab/EmoBank

  2. WASSA 2017共享任务中的"推文中的情绪强度"数据集.http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html

  3. Preotiuc-Pietro和其他人的Valence和Arousal Facebook帖子:http://wwbp.org/downloads/public_data/dataset-fb-valence-arousal-anon.csv

  4. Cecilia Ovesdotter Alm的影响数据:http://people.rc.rit.edu/~coagla/affectdata/index.html

  5. CrowdFlower设置的文本数据中的情感数据 https://www.crowdflower.com/wp-content/uploads/2016/07/text_emotion.csv

  6. ISEAR:http://emotion-research.net/toolbox/toolboxdatabase.2006-10-13.2581092615

  7. SemEval 2007测试语料库(情感文本任务) http://web.eecs.umich.edu/~mihalcea/downloads.html

  8. 用情感重新注释SemEval Stance数据:http: //www.ims.uni-stuttgart.de/data/ssec

如果你想深入讨论这个话题,我推荐一些调查(披露:我写了第一篇).

  1. Buechel,S.,&Hahn,U.(2016).作为回归问题的情绪分析 - 维度模型及其对情绪表征和度量评价的启示.在ECAI 2016.22nd欧洲人工智能会议(第1114-1122页).荷兰海牙(可查阅:http://ebooks.iospress.nl/volumearticle/44864).

  2. Canales,L.,&Martínez-Barco,P.(nd).文本情感检测:一项调查.处理第五届信息系统研究工作日(JISIC 2014),37(可查阅:http://www.aclweb.org/anthology/W14-6905 ).

  • 另一个可能有用的资源是Saif Mohammad的[哈希标签情感语料库](http://saifmohammad.com/WebDocs/Jan9-2012-tweets-clean.txt.zip).有关数据的更多信息,请参阅[本页](http://saifmohammad.com/WebPages/lexicons.html) (3认同)
  • 我对@buechel 的回答没什么评论。1. ISEAR 在所提及的网址下不再可用。2. 我建议您查看论文“An Analysis of Annotated Corpora for Emotion Classification in Text”以获取其他和更新的情绪检测数据集:https://aclweb.org/anthology/C18-1179 (2认同)