如何配置UPS以正确的顺序重启服务器?

Fil*_*ppo 12 ups

这里我们有一些服务器,几乎每个服务器都有一个专用的 UPS。它们之间存在依赖关系,因此必须以正确的顺序打开它们。最终,我们遇到了严重的电源问题,因此服务器会关闭,然后在电源恢复时以随机顺序重新启动。如果服务器在停电期间关闭,这不是问题,重要的是一旦电源恢复,它们无需任何人为干预即可正常工作。

我们的 UPS 非常便宜,对我的目标有用的唯一配置参数是power the load xx seconds after power is restored. 理论上,在每个 UPS 上设置正确的延迟我可以修复服务器重启的顺序,但我不相信 UPS 会按预期运行。

这是正确的方法吗?
高级 UPS 是否提供其他选项来修复重启顺序?
最后一个注意事项:我的 Ups 在 1000 - 2200 VA 范围内

Tom*_*Tom 25

对此的标准答案是“完全没有”。修复软件以随机顺序处理重新启动。如果您确实需要先启动某些服务器(例如:Active Directory),请将它们放在可能存活更长时间的 USV 上。基于低功耗原子的服务器足以作为 Active Directory 控制器,并且可以在小型 USV 上存活一天。

高级 UPS 是否提供其他选项来修复重启顺序?

不。我会说通常假设程序员有足够的能力来正确地解决这个问题。

你可以做的是:

  • 让服务器“随机”启动。除了 DHCP / Active Directory 之外,没有什么真正需要无法修复的订单。
  • 一段时间(5 分钟)后,让控制服务器以正确的顺序启动各种机器上的服务。

我会说这种类型的设置更为常见。我会将任何需要服务器以特定顺序(纯基础设施之外)启动的软件称为损坏且不适合业务的软件。

请注意:我们自己的设置是用于服务器的低成本 20kva USV(低成本,因为我们使用了一个),而从属 2000VA USV 用于作为网络“根”(和备份机器)的机器。Slaved 意味着 USV 在大的后面——所以它只在大的(持续半小时到 8 小时之间,取决于我们的计算网格在线的多少)进入终端关闭时才切换到电池。

  • 我认为这有时说起来容易做起来难(AD,正如你所说,是一个明显的例子)但我同意。正确的解决方案是致力于消除诸如服务器或服务的启动顺序之类的依赖项。如果不出意外,应该可以在网络应用程序上编写代码,例如,“如果我无法连接到我的后端,'睡眠'并稍后再试,而不是可怕地崩溃”。 (2认同)

HBr*_*ijn 14

管理配电单元(而不是 UPS)通常支持在恢复供电后启用单个插座的定制延迟。

通常,这是为了防止断路器在充满系统的机柜在电源恢复后立即同时通电时跳闸,但这也可用于保留系统依赖项的启动顺序。


小智 6

我有这个确切的问题。唯一的区别是我们投资了坚固的机架式 APC 电源装置(例如APC SmartUPS 3000)。使用 APC PowerChute 网络关闭软件(PowerChute Network Shutdown 软件),我可以按特定顺序关闭和启动服务器。该软件的另一个方便的功能是将服务器设置为在最后一分钟关闭,即计算 APC 单元剩余的电池电量并关闭服务器,以便它们有足够的时间正确关闭而不是仅仅关闭电源。

该软件......不是用户友好的,但如果你花一些时间来弄清楚它并不难。如果您有兴趣在基础设施上进行更多投资,这绝对是您要走的路。