每日/每周/每月/每年系统管理员任务

Sco*_*ott 9 maintenance best-practices

这应该是社区维基。我正在尝试列出我们应该定期执行的所有系统管理员任务的列表,因为我相信我们在公司做得还不够。这里的态度是修复问题不方便,但我们没有时间做预防性维护或持续改进。

日常的:

  • 更换每晚备份磁带/驱动器
  • 检查防病毒更新是否已推送到所有系统

每周:

  • 每周更换备份磁带/驱动器
  • 清除所有系统中的临时文件
  • 对所有系统进行碎片整理

每月:

  • 规划基础设施改进
  • 将过时的设备交付/发送给电子产品回收商
  • 重建或更换老化的工作站
  • 测试从备份恢复

年度的:

  • 重建或更换老化的服务器
  • 更换 UPS 电池

Joh*_*ers 7

如果您没有足够的时间进行预防性维护并花费大部分时间解决问题,则需要修改整个方法。与其告诉你每个时期你应该做什么,我会给你一些想法,这样你就不必做事了。

首先,您需要一个良好的监控系统和尽可能多的自动化管理。这两个项目应该比许多管理员意识到的释放更多时间,直到他们将其设置好。

您的监控系统应该为您做的一些事情是:

  • 当邮件或垃圾邮件过滤器队列变得太大或太突然时提醒您。
  • 当驱动器空间太低、CPU 使用率太高等时提醒您。
  • 记录诸如磁盘利用率之类的内容,以便您可以查看随时间变化的趋势。
  • 邮箱也是一样。
  • 当防火墙注册异常数量的命中时提醒您。
  • 为外部世界服务的任何事物也是如此。例如 DNS 和网络服务器。
  • 如果任何机器关闭或卸载了 AV 软件,则在 AV 更新太旧时提醒您。

碎片整理甚至不应该出现在您的任务列表中,因为它应该是一个自动化过程。在您想要的时间间隔让服务器在重新启动后运行磁盘检查和碎片整理。考虑将其与系统绑定以安装排队的更新和补丁(之前已在非生产机器上测试过)。

临时文件夹也可以自动清理。我创建了一个简单的应用程序,它在重启后触发,等待 10 分钟,然后清除所有临时位置。延迟是为了确保它不会删除在重新启动后完成的安装或升级可能需要的文件(很难知道!)。

您必须在适合您的任何时间段手动执行的一件事是监控监控系统和自动化,以确保安全。我每天检查我的,但实际上一年多没有遇到问题。

当你确实让你的系统和自动化运行时,确保你也有一个版本控制系统来放置它。发现最后一个小调整破坏了其他东西,但你不记得你到底改变了什么,这真的很烦人。