纱线的基础设施层与原始地图缩减架构的区别在于以下方式:
在YARN中,作业跟踪器被分为两个不同的守护进程,称为Resource Manager和Node Manager(特定于节点).除了包括仅处理调度作业的调度程序而不担心任何监视或状态更新之外,资源管理器仅管理对不同作业的资源分配.内存,CPU时间,网络带宽等不同资源被放入一个称为的单元Resource Container.AppMasters在不同节点上有不同的运行,它们与许多这些资源容器通信,因此使用监视/状态详细信息更新节点管理器.
我想知道使用这种方法如何从map-reduce角度提高性能?此外,如果纱线背后的动机及其对Map-reduce的现有实施的好处有任何明确的内容,请指出我的相同内容.
我对Hadoop-2.x中tasktracker的位置感到有点困惑.
Hadoop-1.x中的守护进程是namenode, datanode, jobtracker, taskracker and secondarynamenode
Hadoop-2.x中的守护进程是namenode, datanode, resourcemanager, applicationmaster, secondarynamenode.
这意味着 Jobtracker has split up into: resourcemanager and applicationmaster
那么在哪里tasktracker?