Windows 2003 群集的健全补丁计划

use*_*116 7 windows wsus patch-management

我们有一个由 75 个 Win2k3 节点组成的集群在一个粗粒度的计算集群中工作。该集群位于大量防火墙之后,并驻留在其自己的 VLAN 中。各种规模和类型的作业都在集群上运行,并且所有运行的可执行文件都是定制的。

(ed:关于我们的可执行文件的附加说明)这些作业的持续时间从 30 秒到 7 天不等,并且可能包含一个可执行文件或 2000 个子作业(持续时间较短)。显然,我们正在努力避免 IT 在 7 天的生产作业中安排重启的情况。

我们有调度软件,可以容纳粗粒度集群的所有正常任务,我们可以控制哪些机器处于活动状态以进行提交等。如果 WSUS 以某种方式可编写脚本(或者客户端可以声明它可以关闭),我们可以协调两个系统帮帮忙。

目前,补丁时间表是超级星期二之后的星期日,无论集群上运行什么。每次我们想延迟为长时间运行的生产作业修补机器时,我们都必须要求豁免。基本上,虽然我们的团队负责机器,但我们几乎无法控制 IT 的补丁计划。

  1. 对于生产 Windows 集群,按 MS 的计划每月修补一次是否合理?
  2. WSUS 中是否有软件挂钩可以让我们说“请不要重新启动”?

Jim*_*m B 3

1.对于生产 Windows 集群来说,按照 MS 的时间表每月打补丁是否合理?

是的,但是集群不应该有任何与补丁相关的停机时间,因为它应该将作业转移到另一个节点 - 我不会同时修补整个集群(这将是疯狂的)

2.WSUS 中是否有软件挂钩可以让我们说“请先不要重新启动”?

最终用户无法停止 WSUS 更新或重新启动,但在我看来,您的团队和 IT 团队之间确实存在沟通问题;但是,您应该能够一次丢失 1 个节点,而对生产影响很小。

  • 1. 这些作业不能真正进行“故障转移”。使用了约 100 个不同的可执行文件,我认为没有一个可以安全地进行故障转移。2. 哦,我同意我们存在沟通问题,欢迎来到财富 10 强公司。 (2认同)