使用mahout我能够分类数据的情绪.但我陷入困惑矩阵.
我使用mahout 0.7朴素贝叶斯算法来分类推文的情绪.我使用trainnb
和testnb
朴素的贝叶斯分类器来训练分类器并将推文的情绪分类为"积极","消极"或"中立".
样本积极训练集
'positive','i love my i phone'
'positive' , it's pleasure to have i phone'
Run Code Online (Sandbox Code Playgroud)
同样地,我准备了负面和中性的训练样本,这是一个巨大的数据集.
我提供的样本测试数据推文没有包含情绪.
'it is nice model'
'simply fantastic '
Run Code Online (Sandbox Code Playgroud)
我能够运行mahout分类算法,并将分类实例的输出作为混淆矩阵.
下一步我需要找出哪些推文表现出积极的情绪,哪些是否定的.使用分类的预期输出:用情绪标记文本.
'negative','very bad btr life time'
'positive' , 'i phone has excellent design features'
Run Code Online (Sandbox Code Playgroud)
在mahout我需要实现哪种算法以获得上述格式的输出.或者需要任何自定义源实现.
为了"善意"显示数据,建议使用apache mahout提供的算法,这将适合我的Twitter数据情绪分析.