mapReduce模式的最佳python实现是什么?

les*_*lie 4 python mapreduce

什么是最好的Python实现MapReduce,一个框架或一个库,可能和Apache一样好hadoop,但是如果它只是在Python中,并且在良好的文档和易于理解方面最好,完全实现MapReduce模式,高可伸缩性,高稳定性和轻量级.

我用谷歌搜索了一个叫做mincemeat,不确定它,但其他任何一个众所周知的?

谢谢

hym*_*oth 7

如果你搜索它们,这里和那里有一些部分.例如OctopyDisco以及Hadoopy.

不过,我不认为任何人可以在成熟,稳定,可扩展性,性能等对于小的情况下,他们应该足够的条件下进行竞争的Hadoop,但更多的东西"光荣",你必须坚持到Hadoop的.

请记住,您仍然可以使用python/jython在Hadoop中编写map/reduce程序.

编辑:我最近遇到了mrjob.这看起来很棒,因为它简化了编写map/reduce程序然后在Hadoop或Amazon的Elastic MapReduce平台上启动它们的方法.通过这个好消息的文章就在这里