如何分析twitters消息?(改进我的算法)

0x9*_*x90 21 iphone algorithm twitter facebook nlp

我有个好主意实施.我叫它

FixTheUnFixed

这个想法是这样的,想象你在世界各地开车或旅行,当你看到一些障碍或损坏 - 破碎的灯光,覆盖所有街道的垃圾或任何其他问题,你希望负责的权威机构将解决它.

所有你需要做的就是推特这样的东西,你可以使用twitter或Facebook应用程序的继承位置服务添加照片,当然还有位置.

像这样的推文:

@FixTheUnFixed there is a broken fire hydrant here
@FixTheUnFixed my cellular company charged me 18,572$
  for using my iPhone aboard.
Run Code Online (Sandbox Code Playgroud)

我想了很多关于如何处理消息的事情.将出现的大多数问题都是市政当局关注的问题,我希望获得相关市政府的位置和重新推文或向他们发送电子邮件.

获取此地址的两个想法是谷歌它(使用谷歌API).

伪算法是:

1. get the location the Twitter's or Facebook's status sent from.
2. look for key words such as trash, cats, animals etc.
3. finding the relevant authority e-mail , twitter or Facebook account.
4. send the message to the authority account and re-tweet it to the public
     world so they can follow if there is any change.
Run Code Online (Sandbox Code Playgroud)
  • 在3. @ algo有没有聪明的方法来实现它?
  • 我不想向当局发送垃圾邮件,也不发布偷偷摸摸的人的垃圾邮件.
  • 如何改进上面的算法?
  • 如何搜索重建当局的通信资源?

mon*_*ama 8

我的建议是从使用亚马逊机械土耳其人开始 - 为他们处理的每条推文支付真正的人一小笔费用.他们需要确定它是否是垃圾邮件,然后,如果合法,他们将搜索正确的市政联系信息.同时,收集每个处理过的推文的详细统计信息,您可以从中构建数据库.例如,您可以看到所有包含"垃圾"和"芝加哥"的推文都会生成带有特定电话号码的回复.一旦获得足够的数据,您就可以使用它来自动化常见/明确指定的传入推文,并从那里逐步构建,使用土耳其工作人员的研究不断完善您的数据和关联.

还建议只开始有限区域的服务 - 比如纽约或伦敦.(或者你附近最大的城市)这样开始所需的信息要小得多.


0x9*_*x90 0

我认为正确的做法是使用现有的NLP库,例如斯坦福 nlp 库

包括:

  • 斯坦福核心自然语言处理
  • 斯坦福解析器
  • 斯坦福分类器

或者,您可以使用opennlpnltk。如果 NLP 框架是用 java 编写的,并且您想使用 python 或 ruby​​ 作为 OP,则需要检查jrubyjython