在关系中不同主题的情绪分析中处理(得分)分散的正确方法是什么?

Cur*_*ma_ 5 sentiment-analysis

我正在分析社交网络上的情绪.基于相关的不同主题作为输入.我们如何处理个别主题分数的分散?

例如:我们试图对包含不同关键字的主题的主题情绪进行评分,假设主题是创新周,其中包含以下主题(关键字或同义词):

Innovation week = {"innovation week", "data solution", "emerging technologies", "august 30"...}.

如果分数的标准偏差如此之大,该怎么办?我们是否质疑:

  • 情绪分析算法本身?

  • 输入关键字?

  • 或者我们只是按原样取得结果?因为它们代表了构成主题的不同粒度级别的人们的不同观点?最终的目的是对主题有一个总体的见解.

我认为问题很简单,尽管这是社交网络中任何情绪分析研究的一个问题.