Cur*_*ma_ 5 sentiment-analysis
我正在分析社交网络上的情绪.基于相关的不同主题作为输入.我们如何处理个别主题分数的分散?
例如:我们试图对包含不同关键字的主题的主题情绪进行评分,假设主题是创新周,其中包含以下主题(关键字或同义词):
Innovation week = {"innovation week", "data solution", "emerging technologies", "august 30"...}.
如果分数的标准偏差如此之大,该怎么办?我们是否质疑:
情绪分析算法本身?
输入关键字?
或者我们只是按原样取得结果?因为它们代表了构成主题的不同粒度级别的人们的不同观点?最终的目的是对主题有一个总体的见解.
我认为问题很简单,尽管这是社交网络中任何情绪分析研究的一个问题.