小编Pra*_*mod的帖子

在hadoop map reduce中使用分组比较器有什么用

我想知道为什么分组比较器用于二级mapreduce.

根据二级分类的权威指南示例

我们希望键的排序顺序是年份(升序),然后是温度(降序):

1900 35°C
1900 34°C
1900 34°C
...
1901 36°C
1901 35°C
Run Code Online (Sandbox Code Playgroud)

通过将分区器设置为按键的年份部分进行分区,我们可以保证同一年的记录转到同一个reducer.然而,这仍然不足以实现我们的目标.分区程序仅确保一个reducer接收一年的所有记录; 它不会改变reducer在分区内按键分组的事实.

既然我们已经编写了自己的分区器来处理特定reducer的map输出键,那么我们为什么要对它进行分组呢.

提前致谢

hadoop mapreduce hadoop-partitioning

23
推荐指数
2
解决办法
3万
查看次数

获取E0902:发生异常:[用户:oozie不允许冒充oozie]

嗨,我是Oozie的新手,我收到此错误E0902:发生异常:[用户:pramod不允许冒充pramod]当我运行以下命令时

   ./oozie job -oozie htt p://localhost:11000/oozie/ -config ~/Desktop/map-reduce  /job.properties -run.
Run Code Online (Sandbox Code Playgroud)

我的hadoop版本是1.0.3,oozie版本是3.3.2并以伪模式运行

以下是我的core-site.xml的内容

<configuration>

<property>
<name>hadoop.tmp.dir</name>
<value>/home/pramod/hadoop-${user.name}</value>
</property>

<property>
<name>fs.default.name</name>
<value>hdfs://localhost:54310</value>
</property>

<property>



<name>hadoop.proxyuser.${user.name}.hosts</name>                                               
        <value>*</value>
</property>

<property>
        <name>hadoop.proxyuser.${user.name}.groups</name>
        <value>*</value>
</property>

</configuration>
Run Code Online (Sandbox Code Playgroud)

有人可以帮忙

hadoop oozie

5
推荐指数
1
解决办法
6502
查看次数

标签 统计

hadoop ×2

hadoop-partitioning ×1

mapreduce ×1

oozie ×1