Amazon EMR用于向集群添加步骤的文档表明,单个Elastic MapReduce步骤可以向Hadoop提交多个作业.但是,步骤配置的Amazon EMR文档表明,单个步骤只能容纳hadoop-streaming.jar的一次执行(即,HadoopJarStep是HadoopJarStepConfig而不是HadoopJarStepConfigs数组).
在一个步骤中向Hadoop提交多个作业的正确语法是什么?
有没有办法改变数据库指向的位置?
我尝试了以下方法:
alter database <my_db> set DBPROPERTIES('hive.warehouse.dir'='<new_hdfs_loc>');
alter database <my_db> set DBPROPERTIES('location'='<new_hdfs_loc>');
alter database <my_db> set location '<new_hdfs_loc>';
前两个alter语句只更改了DB属性,但数据库仍指向同一位置; 而第三个alter语句给了我语义错误.
任何帮助将受到高度赞赏.
我在RHEL 5.5机器上设置了3节点Zookeeper cdh4集合.我已经通过zkServer.sh在每个节点上运行来启动服务.ZooKeeper实例正在所有节点上运行,但我如何知道它是否是整体的一部分,还是作为单独的服务运行?
我尝试在Cloudera的网站上启动服务并检查此处所述的集合,但它会抛出ClassNotFoundException.