如何将新节点添加到实时hbase/hadoop集群?

Los*_*oul 3 hadoop hbase hdfs

我运行一些批处理作业,数据输入不断变化,我在配置容量方面遇到问题.我正在使用旋转进行初始设置但是一旦我开始,例如,5台机器我不知道如何在它运行时添加新机器.我不知道提前数据将如何复杂或有多大,所以我在想,如果有新的计算机添加到集群的方式,并让它立即生效(或一些延迟,但不希望必须关闭群集并使用新节点启动它.

Dav*_*man 10

有关如何添加节点的确切说明:http: //wiki.apache.org/hadoop/FAQ#I_have_a_new_node_I_want_to_add_to_a_running_Hadoop_cluster.3B_how_do_I_start_services_on_just_one_node.3F

在同一时间 - 我不确定已经运行的作业将利用这些节点,因为计划在作业开始时间运行每个任务的位置(据我所知).
我还认为仅在这些瞬态节点上运行任务跟踪器更为实际.