术语提取和情感分析开源项目

met*_*dos 6 open-source nlp machine-learning

我想从文本中提取重要的术语并创建特定于域的术语集.然后我想了解这些单词在文本中是如何被正面或负面地使用的.

你知道任何开源项目会帮助我完成这项任务吗?

编辑:

示例文本:

"Although car is not comfortable, I like the design of it."
Run Code Online (Sandbox Code Playgroud)

在本文中,我想提取以下内容:

design:        positive
comfort(able): negative
Run Code Online (Sandbox Code Playgroud)

dfb*_*dfb 2

为了解析文本并获取您想要的词性,有很多工具包

http://incubator.apache.org/opennlp/

http://www.nltk.org/

ETC。

查看http://en.wikipedia.org/wiki/Sentiment_analysis如果您指的是内涵,我不知道有什么可靠的平台可以做到这一点,但也许你可以告诉我们更多关于你的问题的一些想法。

如果没有可以为您完成此操作的工具包,您可能会发现将 NP 和 ADJ 链接到它们就足够了。您还需要否定检测。我使用过这个 ohnlp.sourceforge.net (基于 Apache UIMA 构建),它带有一个相当不错的否定检测算法。

  • 我第二个NLTK。有很多博客文章解释了如何将其用于确切的目的,从这里开始:http://streamhacker.com/2010/05/10/text-classification-sentiment-analysis-naive-bayes-classifier/ (3认同)