use*_*111 12 hadoop mapreduce bigdata partitioner
嗨,我想学习如何在hadoop.i中按值排序单词计数.知道hadoop对排序键的排序,而不是值.
我知道要对值进行排序,我们必须有一个分区器,分组比较器和一个排序比较器
但我有点困惑在于将这些概念应用于一起按值排序单词计数.
我们是否需要另一个地图减少作业以实现相同或者组合器来计算出现次数然后在这里排序并将它们发送到减速器?
任何人都可以解释如何按值排序单词计数示例?
Rag*_*ags 11
你需要有第二个mapreduce工作.除非您总结计算总数(第一个MR作业),您如何看待按值排序(单词的计数)?逻辑上不可能.