For*_*Man 6 cluster deployment imaging provisioning
尝试缩短我们的部署时间并寻找您或您的团队用来返回终端和离开数据中心的建议和快捷方式。查看从订购设备到使用寿命结束的整个过程。
如果您大到可以担心大型部署,那么您大到可以使用某种数据库来获取机器信息。它应该包含有关 IP 地址、MAC 地址、机器名称和角色的信息,以及正常型号和供应商信息。使用它来填充配置和安装工具。
如果只是几台机器,系统管理员可能是机架和堆栈的最佳选择。如果部署的机器超过 5-10 台,请聘请承包商进行拆包、上架和布线。他们这样做的频率足够高,以至于他们可以比 1-2 位系统管理员和一些志愿者(阅读实习生)更快地完成任务,并且花费更少的钱。
有一个自动安装设置。对于 Linux,这意味着类似于FAI(Debian 和 Ubuntu)或kickstart(RHEL 和 CentOS)。Solaris 使用jumpstart而 Windows 使用WDS。x86/x86_64 硬件几乎总是支持 dhcp 和 PXE。您可能需要为其他服务器使用 bootp。使用上面提到的数据库来提供配置。测试安装配置脚本是否符合您的预期。然后在硬件安装的最后一步打开您的机器。
拥有一个配置管理系统,其中包含您使用的机器和服务类型的定义。 Puppet和cfengine很受欢迎,但还有很多其他的。让服务器角色来自上述数据库。随着你的成长,这很重要。配置管理工具将确保所有服务器都拥有正确版本的软件以及它们提供的服务所需的所有配置。安装后在初始启动时调用它。使用全新安装运行几次迭代,以确保一切正常。
如果可能的话,一旦所有东西都安装好,在你开始投入用户流量之前,让所有东西都试运行几天。将您的监控设置为在出现问题时向您发送电子邮件,但在刻录期间不要呼叫任何人。如果不可能进行老化,请准备好应对比平时更多的问题,直到您解决了任何早期问题。
每次部署后都有一个回顾。确定哪些做得好,哪些做得不好。确定需要改进的地方并进行改进。这可以是您想要的正式或非正式的。回顾与其他步骤一样重要。这就是您改进流程的方式。
我需要强调的是,您需要在任何部署之前和部署期间测试该过程。测试应该尽可能自动化。随着您对部署的陷阱越来越熟悉,您应该改进您的测试。
这就是一个小团队(2 人)可以在不到 12 个工时添加 50 台或更多机器的方式,不包括打开包装、机架、布线等所花费的时间。