如何将 CloudWatch 自定义日志组与 Python Shell Glue 作业结合使用?

Nis*_*man 5 amazon-cloudwatchlogs aws-glue

我有一些“Python Shell”类型的 Glue 作业,我想将作业日志发送到自定义 CloudWatch 日志组而不是默认日志组。我可以通过提供如下作业参数来实现“Spark”类型胶水作业:

"--enable-continuous-cloudwatch-log" = true
"--continuous-log-logGroup" = "/aws-glue/jobs/glue-job-1"
Run Code Online (Sandbox Code Playgroud)

但相同的参数不适用于 Python Shell 作业(日志仍转到默认日志组 /aws-glue/python-jobs/output 和 /aws-glue/python-jobs/error)。对于 Python Shell 作业有什么方法可以实现这一点吗?

Far*_*hat 4

continuous-log-logGroup是 AWS Glue Spark 作业附带的东西,但不适用于 Python Shell 作业。您可以做的最接近的事情是配置写入 CloudWatch 的日志处理程序。了望塔是一个很受欢迎的:

import watchtower, logging
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)
logger.addHandler(watchtower.CloudWatchLogHandler(log_group='watchtower', stream_name='bla'))
logger.info("Hi")
logger.info(dict(foo="bar", details={}))
Run Code Online (Sandbox Code Playgroud)

您也可以直接使用Cloudwatch Logs API:

logs = boto3.client('logs')

LOG_GROUP='TUTORIAL-DEV2'
LOG_STREAM='stream1'

logs.create_log_group(logGroupName=LOG_GROUP)
logs.create_log_stream(logGroupName=LOG_GROUP, logStreamName=LOG_STREAM)


timestamp = int(round(time.time() * 1000))

response = logs.put_log_events(
    logGroupName=LOG_GROUP,
    logStreamName=LOG_STREAM,
    logEvents=[
        {
            'timestamp': timestamp,
            'message': time.strftime('%Y-%m-%d %H:%M:%S')+'\tHello world, here is our first log message!'
        }
    ]
)
Run Code Online (Sandbox Code Playgroud)

这个例子来自这个要点:https://gist.github.com/olegdulin/fd18906343d75142a487b9a9da9042e0