数据识别用于数据挖掘和基于文本的分析

sun*_*dev 4 algorithm twitter machine-learning data-mining

我正在创建一个软件,用于转储任何用户评论和发布在他们的Twitter个人资料上的关于某些化妆品"XYZ"的纯文本.我解析了从Twitter API收到的JSON对象,并将原始数据转储到MySql数据库中.

现在我必须分析这些纯文本以获取模式,无论是关于化妆品"XYZ"的好评还是坏评论等,并将此信息提供给单独的API以创建HTML中的dymnamic可视图表.

我在DataMining和基于文本的模式识别领域是全新的.如果有人能够建议如何从我的数据库中的纯文本继续使用模式识别算法来为我的单独的可视化图表API提供提要,那么我们将非常感激.

use*_*064 12

我真的很鼓励你观看以下NLP斯坦福大学的讲座,特别是:

  • 第3周 - 情感分析(这是你想要达到的目标)
  • 第4周 - 关系提取(赫斯特模式等)
  • 我想你会发现它们是非常宝贵的资源.

    • 嗨,@ user278064,如果可能,您能否更新“NLP 斯坦福讲座”链接?由于当前链接现在似乎已弃用。谢谢你。 (2认同)