Hadoop应用程序开发和PHP

Arv*_*ind 5 php hadoop symfony1

对于hadoop应用程序开发,PHP框架不太受欢迎吗?如果是这样,为什么?另外,请为特定框架指出文献/文档/教程?(Symfony的东西太棒了!)

Vla*_*lad 6

基本上,Hadoop允许您运行将自己的java类发送到集群中,以便在适当的时间在适当的服务器上运行.用于Hadoop的所有非JVM语言API基本上都涉及运行预先存在的java类,因此没有什么可以实现的.

另外,hadoop并不是真正的交互式框架.它适用于在合理的时间内批量处理大量数据.一个拇指的规则是如果你的子作业一步完成少于15MB,你就不应该打扰hadoop.设置作业和改组数据和结果的开销只会让你失望.

没有什么可以阻止你为PHP创建自己的hadoop API,就像它为Python做的那样.然而,PHP并不是真正受到大规模数据处理的人群的欢迎.

  • 那么trendingtopics.org实际上没有使用Ruby来实现hadoop目的.Ruby仅用作数据库的前端.数据库由hadoop作业填充.hadoop作业是用hive和python组合编写的.这是代码http://github.com/datawrangling/trendingtopics/tree/master/lib/scripts/.当我提到python绑定时,它正是我想到的应用程序. (2认同)