在Amazon EMR上使用Mrjob处理MongoDB数据

Ese*_*gün 6 python hadoop mongodb amazon-emr mrjob

我知道Mrjob使用Hadoop Streaming.我也知道有一个插件可以将MongoDB与Hadoop Streaming一起使用.但是,我找不到任何将两者结合在一起的例子.

这(至少在理论上)是否可能?如果是这样,是否有相关的示例或教程?请注意,我愿意扩展Mrjob库甚至回到Boto.