我们经常需要弄清楚以下问题:
server x
?license x
到期?host x
?feature x
吗?大家是怎么处理这些问题的?是否有工具或软件可以帮助准确记录所有或大部分这些项目?
我可以告诉你什么是行不通的:手动编辑的文档、电子表格、网页或维基。
我还没有看到一个组织足够严格,能够手动保持其技术文档 100% 准确和最新。不准确的文档不仅令人烦恼,而且还令人烦恼。这很危险。如果有人忘记注意正在service a
运行会发生什么server x
?如果您信任该文档,您最终会遇到意外的service a
.
该解决方案的第一部分是使用 Xymon、Nagios 或 Zabbix(还有很多其他平台)等监控平台实现流程自动化。可以使用自定义脚本扩展这些平台,以回答有关软件和硬件的大多数问题。监控平台将确保该自动文档保持最新。
解决方案的第二部分是建立一种机制,在您的覆盖范围不完整时向您发出警告。例如,我使用一个自定义脚本,它列出了系统上运行的所有进程,过滤掉受监视或可忽略的进程,并提醒我任何意外情况 - 这告诉我是时候将这些新进程添加到监控平台。另一个示例是将 Cisco 端口状态与 CDP 信息交叉引用,以确保覆盖所有服务器。
这种方法的巨大好处是,您可以编写文档并免费获得警报和趋势。
归档时间: |
|
查看次数: |
249 次 |
最近记录: |