是否可以使用word2vec模型对未标记的文本进行情感分析?

Piy*_*iya 7 sentiment-analysis gensim word2vec python-3.7

我有一些文本数据需要进行情感分类。我对此数据没有正面或负面标签(未标记)。我想使用 Gensim word2vec 模型进行情感分类。
是否有可能做到这一点?因为到目前为止我找不到任何可以做到这一点的东西?每个博客和文章都使用某种标记数据集(例如 imdb 数据集)来训练和测试 word2vec 模型。没有人进一步预测自己的未标记数据。

有人可以告诉我这种可能性(至少理论上)吗?

提前致谢!

小智 3

是的,就像任何机器学习问题一样,有两种主要方法来处理情绪。有监督情感分析和无监督情感分析。第一种方式,你肯定需要一个带标签的数据集。这样,您可以使用简单的逻辑回归或“LSTM”等深度学习模型。但在无监督的情感分析中,您不需要任何标记数据。这样,您就可以使用聚类算法。K-Means 聚类是此任务的流行算法。以下媒体文章包含您的解决方案的有效示例,

https://towardsdatascience.com/unsupervised-sentiment-analysis-a38bf1906483

添加您的问题,Word 嵌入(例如 word2vec 或 fasttext)与监督或无监督情感分析无关。有非常强大的方法来表示数据集的特征。顺便说一句,根据我的经验,fasttext 比 word2vec 更准确。