美好的一天,我正在尝试在python(使用naive-bayes分类器)中编写一个感性分析应用程序,目的是将新闻中的短语分类为正面或负面.而且我在寻找合适的语料库时遇到了一些麻烦.我尝试使用"General Inquirer"(http://www.wjh.harvard.edu/~inquirer/homecat.htm),但是我有一个大问题.由于它是单词列表,而不是短语列表,因此在尝试标记以下句子时会发现以下问题:
预计他不会获胜.
这句话被归类为正面,这是错误的.原因是"胜利"是积极的,但"不"没有任何意义,因为"不胜"是一个短语.任何人都可以建议一个语料库或解决该问题?您的帮助和见解非常受欢迎.
小智 4
例如,参见 Councill、McDonald 和 Velikovich 的“什么是伟大的,什么不是:学习对否定范围进行分类以改进情感分析”
http://dl.acm.org/itation.cfm?id=1858959.1858969
和后续行动,
http://scholar.google.com/scholar?cites=3029019835762139237&as_sdt=5,33&sciodt=0,33&hl=en
例如 Morante 等人 2011
http://eprints.pascal-network.org/archive/00007634/