AWS EMR 错误:作业流中的所有从站都已终止

May*_*wal 1 hive amazon-web-services elastic-map-reduce

我在 Amazon AWS 上使用 Elastic Mapreduce 基础设施。一个 jowflow 自动终止。根据 Amazon 控制台的最后状态更改原因是:“作业流中的所有从站都已终止”。

创建作业流命令:

elastic-mapreduce --create --name MyCluster --alive --instance-group master --instance-type m1.xlarge --instance-count 1 --bid-price 2.0 --instance-group core --instance-type m1.xlarge --instance-count 10 --bid-price 2.0 --hive-interactive  --enable-debugging
Run Code Online (Sandbox Code Playgroud)

关于工作流程的详细信息: 在此处输入图片说明

日志的最后几行...

Total MapReduce jobs = 2
Launching Job 1 out of 2
Number of reduce tasks not specified. Estimated from input data size: 1
In order to change the average load for a reducer (in bytes):
  set hive.exec.reducers.bytes.per.reducer=<number>
In order to limit the maximum number of reducers:
  set hive.exec.reducers.max=<number>
In order to set a constant number of reducers:
  set mapred.reduce.tasks=<number>
Starting Job = job_201310231204_0099, Tracking URL = http://ip-10-197-16-105.us-west-1.compute.internal:9100/jobdetails.jsp?jobid=job_201310231204_0099
Kill Command = /home/hadoop/bin/hadoop job  -Dmapred.job.tracker=10.197.16.105:9001 -kill job_201310231204_0099
2013-10-23 14:11:38,618 Stage-1 map = 0%,  reduce = 0%
2013-10-23 14:11:48,741 Stage-1 map = 100%,  reduce = 0%
Run Code Online (Sandbox Code Playgroud)

正如您在上面的日志中看到的那样,不会抛出任何错误。

我认为的原因是

我认为这是因为现货实例价格突然上涨。更多细节在我下面的回答中。

May*_*wal 5

我在这里回答我自己的问题。

我认为这是因为现货实例的价格突然上涨。对于 m1.xlarge 实例,我的出价为每小时每个实例 2 美元。

aws 控制台现货实例定价快照:

aws 控制台现货实例定价快照

您可以注意到定价的蓝色跳跃。我的出价是 2 美元,实际价格跳升至 11 美元。因此我的集群被自动杀死。

  • 避免此类问题的策略之一是将主实例和核心实例保留为按需实例,将任务实例保留为现场实例。这将保护集群免受价格上涨的影响,但会导致更高的成本。此策略由 AWS Datapipeline 使用。 (4认同)