AWS EMR上的ClusterID与JobFlowID

use*_*288 8 boto amazon-web-services emr

我对可用的API和两个标识符感到有点困惑.我正在使用boto,但不要认为这是问题所在:我的问题是关于任何api(但不是cli).

我用RunJobFlow启动一个JobFlow,它返回一个JobFlowId.让我们假设我不想保留数字,而是稍后找到JobFlow正在运行的内容,以便为它们添加步骤.

我想我应该可以使用DescribeJobFlows来查找所有jobflow_ids并从那里继续.但是在文档(http://docs.aws.amazon.com/ElasticMapReduce/latest/API/API_DescribeJobFlows.html)上,此api调用被标记为已弃用,并指示我们使用ListClusters,它返回cluster_ids.

是什么把2联系在一起?它是同一个标识符吗?如果不是,我如何从群集ID获取作业流ID?

我认为混淆还来自于cli命令是"create-cluster"并返回cluster_id,add-steps也需要cluster_id ....

Chr*_*erB 12

集群ID和作业流ID是相同的(j - ######).集群ID是一个更合适的名称,因为它不会与Hadoop中看到的作业术语混淆.所以继续使用ListClusters(http://docs.aws.amazon.com/ElasticMapReduce/latest/API/API_ListClusters.html).