为什么我无法从 AWS Lambda 运行我的 ECS 任务?

mma*_*nry 4 amazon-web-services amazon-ecs boto3 aws-lambda

我正在使用 Amazon Web Services 并尝试在由 Lambda 触发的集群上运行 ECS 任务定义。

当我在 ECS 控制台中手动运行此任务并选择传递给 run_task 的所有相同选项时,它运行得很好。我在 Cloudwatch 中看到日志,并且任务(更新数据库)的效果已按预期发生。但是,当我从 Lambda 运行该任务时,它不起作用,但也没有给出任何我能看到的错误。

这是 Lambda 定义:

import boto3

def lambda_handler(event, context):
    print("howMuchSnowDoUpdate")
    client = boto3.client('ecs')
    response = client.run_task(
        cluster='HowMuchSnow',
        taskDefinition='HowMuchSnow:2',
        count=1,
        launchType='FARGATE',
        networkConfiguration={
            'awsvpcConfiguration': {
                'subnets': [
                    'subnet-ebce7c8c',
                ],
                'securityGroups': [
                    'sg-03bb63bf7b3389d42',
                ],
                'assignPublicIp': 'DISABLED'
            }
        },
    )
    print(response)
Run Code Online (Sandbox Code Playgroud)

我已为 Lambda 的 IAM 角色授予 ECSFull 策略。在此之前,我在运行 run_task 时收到了预期的权限被拒绝的信息。但是,一旦我添加了该策略,Lambda 就运行得很好,没有报告任何错误,这是我从 print(response) 行得到的响应:

{'tasks': [{'taskArn': 'arn:aws:ecs:us-east-1:221691463461:task/10b2473f-482d-4f75-ab43-3980f6995b17', 'clusterArn': 'arn:aws:ecs:us-east-1:221691463461:cluster/HowMuchSnow', 'taskDefinitionArn': 'arn:aws:ecs:us-east-1:221691463461:task-definition/HowMuchSnow:2', 'overrides': {'containerOverrides': [{'name': 'HowMuchSnow'}]}, 'lastStatus': 'PROVISIONING', 'desiredStatus': 'RUNNING', 'cpu': '256', 'memory': '512', 'containers': [{'containerArn': 'arn:aws:ecs:us-east-1:221691463461:container/9a76562b-1fef-457f-ae04-0f0eb4003e7b', 'taskArn': 'arn:aws:ecs:us-east-1:221691463461:task/10b2473f-482d-4f75-ab43-3980f6995b17', 'name': 'HowMuchSnow', 'lastStatus': 'PENDING', 'networkInterfaces': []}], 'version': 1, 'createdAt': datetime.datetime(2019, 6, 17, 14, 57, 29, 831000, tzinfo=tzlocal()), 'group': 'family:HowMuchSnow', 'launchType': 'FARGATE', 'platformVersion': '1.3.0', 'attachments': [{'id': 'e6ec4941-9e91-47d1-adff-d406f28b1931', 'type': 'ElasticNetworkInterface', 'status': 'PRECREATED', 'details': [{'name': 'subnetId', 'value': 'subnet-ebce7c8c'}]}]}], 'failures': [], 'ResponseMetadata': {'RequestId': '3a2506ef-9110-11e9-b57a-d7e334b6f5f7', 'HTTPStatusCode': 200, 'HTTPHeaders': {'x-amzn-requestid': '3a2506ef-9110-11e9-b57a-d7e334b6f5f7', 'content-type': 'application/x-amz-json-1.1', 'content-length': '1026', 'date': 'Mon, 17 Jun 2019 14:57:29 GMT'}, 'RetryAttempts': 0}}
Run Code Online (Sandbox Code Playgroud)

在我看来,这看起来不错。但该任务从未真正运行。我确实在 ECS 控制台的任务列表中短暂地看到了集群的待处理任务。但它的运行时间并没有实际任务应该运行的时间长。它不会像我手动运行时那样在 CloudWatch 中生成日志。我在日志中也没有看到任何错误。

我要注意的一件事是,当从控制台手动运行任务时,我必须选择一个 VPC,但这不是 boto3 的 ECS run_task 函数的有效参数,因此我没有传递它。

有人知道可能出了什么问题或者我可以在哪里查找信息吗?

ope*_*onk 7

这对我有用。

设置 Lambda 时:

  • 角色必须具有 ECS 运行任务的能力
  • 不要在 Lambda 函数设置本身中指定 VPC

这是 Lambda 代码(将子网、安全组等替换为您自己的)。

import boto3

client = boto3.client('ecs')

cluster_name = "demo-cluster"
task_definition = "demo-task:1"

def lambda_handler(event, context):
    try:

        response = client.run_task(
            cluster=cluster_name,
            launchType = 'FARGATE',
            taskDefinition=task_definition,
            count = 1,
            platformVersion='LATEST',
            networkConfiguration={
                'awsvpcConfiguration': {
                    'subnets': [
                        'subnet-0r6gh701', 
                        'subnet-a73d7c10'
                    ],
                    'securityGroups': [
                        "sg-54cb123f",
                    ],
                    'assignPublicIp': 'ENABLED'
                }
            })

        print(response)

        return {
            'statusCode': 200,
            'body': "OK"
        }
    except Exception as e:
        print(e)

        return {
            'statusCode': 500,
            'body': str(e)
        }    

Run Code Online (Sandbox Code Playgroud)