在Mapreduce中,复制是否也适用于中间数据?

Sur*_*aja 4 hadoop mapreduce

在Mapreduce中,我们说映射器产生的输出称为中间数据.

中间数据是否也被复制?

中间数据是暂时的吗?

中间数据何时被删除?是自动删除还是我们需要明确删除它?

Ram*_*ram 6

Mapper的溢出文件存储在运行Mapper的工作节点的本地文件系统中.类似地,从一个节点流到另一个节点的数据存储在运行任务的工作节点的本地文件系统中.

此本地文件系统路径由hadoop.tmp.dir property 指定 ,默认为'/ tmp'.

在作业完成或失败后,本地文件系统上使用的临时位置会自动清除,您不必执行任何清理过程,它将由框架自动处理.

  • 任何进入hdfs的东西都有默认的复制因子.但在这种情况下,数据存在于本地文件系统中.因此它没有被复制.是的,它们会自动清除 (2认同)