如何向 Sagemaker 端点添加运行状况检查?

Mar*_*oma 6 amazon-web-services amazon-sagemaker

我的 sagemaker 端点有一个 /ping,根据 AWS Cloudwatch,它大约每 5 秒就会被 ping 一次:

10.32.0.1 - - [01/Feb/2018:08:08:35 +0000] "GET /ping HTTP/1.1" 200 1 "-" "AHC/2.0"
Run Code Online (Sandbox Code Playgroud)

但是,我不知道如果此 ping 失败会发生什么。在哪里可以配置健康检查?

Guy*_*Guy 0

Amazon SageMaker 是一项托管服务,服务团队的责任是确保其可用。他们正在监视您的端点,并会在需要时为您替换容器和实例。

您可以使用 CloudWatch 指标 ( https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html )监控终端节点的性能,但它更倾向于正确选择实例类型和您想要拥有的实例数量(您的成本),而不是 (ping) 可用性。