NOC 态势感知

dr.*_*ter 6 analytics datacenter

在我们的 NOC 中,我们保持对所有物理安全区域的态势感知(反应性视频源)、有关数据中心物理特性的一些基本信息、天气和国家新闻源。您是否有其他推荐的 NOC 监视器,或者这是否足够好。

sh-*_*eta 10

这是一个相当广泛的问题,但我假设我们正在避免服务或逻辑级别的监控(即 SSH 侦听、网站正确响应、磁盘空间、CPU 使用率等)。

您的 NOC 应该同时进行持续的手动监控以及定期的手动/人工监控。

持续监控:

  • 来自数据中心多个传感器的环境温度/湿度
  • 数据中心所有电路的功耗
  • 交流装置的自我报告负载/健康状况
  • 数据中心内部、所有数据中心入口和 NOC 区域入口的视频源
  • UPS电池状态
  • 记录数据中心的所有入口/出口(无论是通过刷卡还是手动登录)
  • 交换机端口/路由器接口状态事件(上/下/速度变化)

定期演练:

  • 机架关闭并锁定
  • 任何声音或视觉硬件警报(灯光、音调、状态 LCD)
  • 地砖到位且状况良好
  • 数据中心入口关闭并锁定
  • 相机不受干扰
  • 数据中心内或周围没有意外访客
  • 灯坏了,窗户坏了,门坏了,任何让物理安全更容易被破坏的东西

另外,为什么要打扰全国新闻提要?除非您的数据中心分布在全国各地,否则收听当地新闻台会更有意义。不过,作为一个整体的价值是值得怀疑的,因为它将是一个非常高的噪声:信号比。如果有的话,只需从您的相关新闻媒体订阅 RSS 提要。

最后,这可能不是您要找的,但我发现在我的网络之外进行测试非常宝贵。使用大小数据包测试几个知名网络(谷歌、雅虎、微软等)的高延迟或数据包丢失,检查常见网站以获取正确的返回代码,并测量电子邮件往/返几个流行的免费邮件的往返延迟在我的用户开始打电话之前,网站(Yahoo、Hotmail、Gmail)已经让我解决了几个微妙的问题。