小编Mar*_*hes的帖子

如何判断 kubernetes 集群中的容器何时/是否/为什么重启?

我在 google 容器引擎中有一个单节点 kubernetes 集群可以玩。

现在,我托管的一个小型个人网站已经离线了几分钟。当我查看容器的日志时,我看到最近完成的正常启动序列,因此我假设一个容器死亡(或被杀死?)并重新启动。

我怎样才能弄清楚发生这种情况的方式和原因?

有没有办法在容器意外启动/停止时收到警报?

kubernetes

46
推荐指数
4
解决办法
5万
查看次数

如何使用 MySQL/Amazon RDS 调试锁定超时?

我们有一个托管在 Amazon Web 服务上的 Web 应用程序。我们的数据库是一个运行 5.1.57 的多可用区 RDS MySQL 服务器,并且有 3-4 个应用服务器与之通信。

今天,我们开始看到很多类似“超出锁定等待超时;尝试重新启动事务”的错误 - 几乎 1% 的 POST 请求会看到这种情况。

网站上运行的代码没有任何修改。没有架构更改。我们还没有出现流量大幅增长的情况。我一直在查看正在运行的进程,似乎没有一个进程失控。

我尝试将 RDS 实例从小到大进行扩展,但没有效果。

两天前,亚马逊出现了一些中断。作为恢复的一部分,我们的 RDS 服务器和应用程序服务器最终位于不同的可用区域,但都在同一区域内。但昨天,一切都很好,所以我不相信这是相关的。

锁超时发生在不同类型的请求中,并且发生在不同的 InnoDB 表中。

我注意到,当我们开始看到问题时,打开的连接数量会猛增,但这可能只是一种症状,而不是原因。

调试此问题的下一步是什么?

连接图

mysql amazon-ec2 amazon-web-services amazon-rds

5
推荐指数
1
解决办法
4898
查看次数