Cur*_*ma_ 2 python machine-learning sentiment-analysis vader
我陷入了情绪分析,发现了Vader解决方案,这是迄今为止我能找到的最好的解决方案。我的问题是,我找不到任何有关如何用英语以外的其他语言来喂养它的文档。
最简洁的答案是不”。
github页面上的README文件指出
如果您可以访问Internet,则演示中将提供一个示例,说明VADER如何处理其他语言(非英语文本句子)的文本情感。
但是,如果您看一下此演示的实际操作(从vaderSentiment.py当前版本的 552行开始),这完全基于使用机器翻译Web服务自动将文本翻译成英语。因此,结果不仅取决于情感分析工具的准确性,还取决于您用来创建输入的英语版本的任何翻译工具的准确性。
Vader仅对英语文本进行情感分析,但是这种解决方法(自动翻译)可能是可行的选择。与其他用法相比,情感分析对常见的机器翻译问题较不敏感*,但是,如果您选择使用该替代方法,那么您当然仍然必须牢记这些限制。
*例如,演示中使用的服务翻译为“ Das Internet funktioniert heute nicht。Ist eineStörungbekannt?” 改为“互联网今天无法正常工作。是否已知有问题?”,可以更准确地解释为“互联网今天无法正常工作。是否知道中断?”。第一句话中的时态错误,尽管在这种情况下“Störung”有几种合法的翻译,但“ disorder”充其量是一个尴尬的选择。尽管如此,尽管这通常会使翻译变得很糟糕,但这些错误不太可能显着影响情感分析。