Hadoop mapreduce来自HBase的流媒体

Ric*_*man 6 hadoop hbase mapreduce

我正在构建一个Hadoop(0.20.1)mapreduce作业,它使用HBase(0.20.1)作为数据源和数据接收器.我想用Python编写这个工作,它要求我使用hadoop-0.20.1-streaming.jar来传输数据到我的Python脚本之间.如果数据源/接收器是HDFS文件,这可以正常工作.

Hadoop是否支持从/向HBase流式传输mapreduce?

Ric*_*man 1

这似乎符合我的要求,但它不是 Hadoop 发行版的一部分。任何其他建议或意见仍然欢迎。

http://github.com/wanpark/hadoop-hbase-streaming