Pra*_*ati 7 hadoop mapreduce pull
根据Hadoop:The Definitive Guide.
新API支持"推"和"拉"式迭代.在这两个API中,键值记录对被推送到映射器,但此外,新API允许映射器从map()方法中提取记录.减速机也是如此."拉"样式如何有用的一个例子是批量处理记录,而不是逐个处理.
有没有人在Map/Reduce函数中提取数据?我对API或示例感兴趣.
我发布了一个查询@ mapreduce-user@hadoop.apache.org并得到了答案.
可以通过调用nextKeyValue()从传递给映射的上下文对象中检索下一个键值对.因此,您将能够在新API中从中提取下一个数据.
在这种情况下,拉动的性能是否优于推动?此外,拉动有用的场景是什么?
| 归档时间: |
|
| 查看次数: |
3309 次 |
| 最近记录: |