Tob*_*obi 17 java hadoop cluster-computing hadoop-yarn
Apache Helix和Hadoop YARN(MRv2)有什么区别.有没有人有这两种技术的经验?有人能解释一下Helix对YARN的优缺点,以及为什么LinkedIn人开发自己的集群管理而不是使用YARN?
在此先感谢Tobi
小智 48
虽然Helix和YARN都提供了管理分布式应用程序的功能,但两者之间存在重要差异.
YARN主要提供跨机器群集的资源管理功能,同时要求应用程序编写其自定义逻辑以从资源管理器协商资源.另一方面,Helix提供了一种声明性地管理分布式应用程序状态的方法,从而使应用程序不必进行自定义实现.目前,Helix不像YARN那样提供资源管理功能.因此,这两个系统是相辅相成的.
作为一个例子,假设您有一组节点,并且您想要在它们上启动一些容器.
YARN提供了执行上述操作的框架/机制.拥有容器后,必须实现以下功能:
Helix可以轻松实现上述功能.在YARN中,需要编写应用程序主机来实现这些(这种实现的一个例子是hadoop map reduce作业的Application master).
Helix是在LinkedIn开发的,用于管理在线/近线空间的分布式数据系统.在这个空间中,一旦容器被启动,它就会一直运行直到它崩溃.当容器发生故障时,可能会在剩余的容器中重新分配任务.
YARN附带资源调度算法,可以灵活高效地利用可用硬件来完成短暂的任务,例如地图缩减作业.
| 归档时间: |
|
| 查看次数: |
5691 次 |
| 最近记录: |