*您*如何跟踪和记录日常维护?

Zak*_*Zak 10 maintenance monitoring

遇到服务器故障,你们使用什么软件或系统来提醒您进行日常维护?您如何核对清单并记录您应该检查的各种项目?你有内部流程文件吗?您是否每周都有 cron 邮件提醒您检查系统日志?

另外,您是否在一个团队中工作进行系统维护,如果是,您如何协调谁将进行哪些维护?

如果您使用错误/问题跟踪系统来输入任务,您是否有一个 cron 作业输入重复性任务?

vor*_*aq7 5

我目前正在使用 Request Tracker ( http://www.bestpractical.com/rt )
所有维护事件都会在“系统”队列中获得相关的票证。遇到的问题、谁做了什么工作、什么时候工作等的注释都被输入到工单中,以及必要的批准。

目前,我们的重复性任务(季度修补等)是手动创建的,但它们可以很容易地自动化(cron 作业 + 电子邮件)。

协调谁在做什么工作对我们来说相对容易,因为我们的管理组中只有 2 人,但随着我们扩大计划,计划是为维护事件创建主票并使用分配给负责方的子票来委派工作.


日常工作(日志检查等)是另一回事:我将所有这些都交给了自动化流程:

  • InterMapper密切关注服务器的整体状态(寻找高负载、低磁盘空间等的 SNMP 查询)、我们的 Web 界面的功能以及可能表明出现问题的各种其他事情。
  • Syslog-NG从我们的主机收集日志,并通过一堆脚本来检查明显的不良情况。我偶尔会查看日志以检查脚本的完整性,但它不是定期安排的。