Sco*_*ott 9 maintenance best-practices
这应该是社区维基。我正在尝试列出我们应该定期执行的所有系统管理员任务的列表,因为我相信我们在公司做得还不够。这里的态度是修复问题不方便,但我们没有时间做预防性维护或持续改进。
日常的:
每周:
每月:
年度的:
如果您没有足够的时间进行预防性维护并花费大部分时间解决问题,则需要修改整个方法。与其告诉你每个时期你应该做什么,我会给你一些想法,这样你就不必做事了。
首先,您需要一个良好的监控系统和尽可能多的自动化管理。这两个项目应该比许多管理员意识到的释放更多时间,直到他们将其设置好。
您的监控系统应该为您做的一些事情是:
碎片整理甚至不应该出现在您的任务列表中,因为它应该是一个自动化过程。在您想要的时间间隔让服务器在重新启动后运行磁盘检查和碎片整理。考虑将其与系统绑定以安装排队的更新和补丁(之前已在非生产机器上测试过)。
临时文件夹也可以自动清理。我创建了一个简单的应用程序,它在重启后触发,等待 10 分钟,然后清除所有临时位置。延迟是为了确保它不会删除在重新启动后完成的安装或升级可能需要的文件(很难知道!)。
您必须在适合您的任何时间段手动执行的一件事是监控监控系统和自动化,以确保安全。我每天检查我的,但实际上一年多没有遇到问题。
当你确实让你的系统和自动化运行时,确保你也有一个版本控制系统来放置它。发现最后一个小调整破坏了其他东西,但你不记得你到底改变了什么,这真的很烦人。