给定一组指定的数据时,什么决定了要使用的映射器/减速器的数量

Abh*_*ain 1 java hadoop mapreduce

决定对给定数据集使用映射器和缩减器数量以实现最佳性能的因素有哪些?我说的是 Apache Hadoop MapReduce 平台。

Pra*_*ati 5

根据 Cloudera博客

您是否设置了映射器和减速器的最佳数量?
映射器的数量默认设置为每个 HDFS 块一个。这通常是一个很好的默认值,但请参阅技巧 2。reducer
的数量最好设置为集群中的reduce slot 的数量(减去一些以允许失败)。这允许减速器在单波中完成。