YARN MapReduce 作业如何处理容器故障?

Ali*_*Ali 3 hadoop mapreduce hadoop-yarn hadoop2

YARN 中如何处理软件/硬件故障?具体来说,如果容器发生故障/崩溃,会发生什么?

Ali*_*Ali 5

  • 容器和任务失败由节点管理器处理。当容器发生故障或死亡时,节点管理器会检测到故障事件并启动一个新容器来替换发生故障的容器并在新容器中重新启动任务执行。
  • 在 application-master 发生故障的情况下,资源管理器检测到故障并使用新容器启动 application-master 的新实例。

此处查找详细信息