ec2 实例状态检查失败

bba*_*oy8 2 amazon-ec2 amazon-web-services

我目前正在 ec2 服务器上运行一个需要在后台一致运行的进程。我尝试登录到服务器,但仍然收到网络错误:连接超时提示。当我检查实例时,我收到以下消息:

实例可达性检查于 UTC-5 2020 年 2 月 22 日晚上 11:15:00 失败(1 天 13 小时 34 分钟前)

为了排除故障,我尝试重新启动服务器,但这并没有解决问题。我如何纠正这个问题并防止它再次发生?

Asf*_*had 5

实例状态检查失败表示实例存在问题,例如:

  • 无法启动操作系统
  • 无法正确安装卷
  • 文件系统问题
  • 不兼容的驱动程序
  • 内核恐慌
  • 严重的记忆压力

您可以检查以下故障排除 https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/TroubleshootingInstancesStopping.html

为了将来报告和自动恢复,您可以创建CloudWatch 警报

对于第二部分

您无法阻止它的发生,但为了正常运行时间和可用性是的,您可以创建另一个 EC2 并在两个实例的顶部添加ALB以检查实例的健康状况,以便您的用户/客户/服务在运行期间可用恢复时间(从第二个实例)。您可以根据需要增加实例数量以获得高可用性(显然这涉及成本)

  • 或者甚至更好地将 EC2 放入 Auto Scaling 组中。ALB 执行运行状况检查,如果失败,将不再将流量路由到该 EC2,然后 ASG 将发送状态检查并停止轮换无响应的服务器。 (2认同)