你知道,你看到像下面这样的图片,在你真的不得不处理它之前会咯咯地笑。
我刚刚继承了如下图所示的东西。组织的文化不能很好地容忍停机时间,但我的任务是“清理它”。网络按原样运行,似乎并不急于完成它,但我将不得不在某个时候解决这个问题。当我提到周末的任何事情时,我都会受到丑陋的目光。
所以我的问题是,有没有一种结构化的方法来解决这个问题?
到目前为止我的想法:

在安装机架式服务器时,心态上似乎存在很多分歧。已经有线程讨论电缆臂和其他机架安装配件,但我很好奇:
安装服务器时,您是否在服务器之间留了一个空的机架单元?为什么或者为什么不?你有任何经验证据来支持你的想法吗?有没有人知道一项研究可以最终证明一个人是否更好?
当我在我们的服务器机房工作时,我注意到它很冷。
我知道服务器机房必须很冷才能抵消服务器的热量,但也许它太冷了。
保持我们的服务器机房的合适温度是多少?
假设我有一个机架,里面有几台服务器和其他东西。其中一台服务器严重过热,并且在附近有一名维修人员时开始冒烟或着火。
如果在公寓中发生类似情况并且附近有灭火器,则立即使用灭火器通常可以非常快速地灭火,但如果服务器机架不正确灭火可能会对周围设备造成不必要的额外损坏。
澄清一下,我说的是一场非常小的火灾,人们可以在不冒生命危险的情况下尝试扑灭它——比如拿起附近的灭火器,将其排放,然后在 15 秒内将火扑灭。
扑灭服务器机架中的小型局部火灾的策略是什么?要使用什么类型的灭火器?如何尽量减少对周边设备的损坏?
服务器机房灭火的最新技术是什么?选择一个好的系统的首要任务是什么?
我客户的一个网站上周受到了直接闪电袭击(巧合的是在 13 日星期五!)。
我离现场很远,但与现场人员一起工作时,我发现了一种奇怪的损坏模式。两个互联网链接都断开了,大多数服务器都无法访问。大部分损坏发生在MDF 中,但一个光纤连接的IDF也丢失了交换机堆叠成员上 90% 的端口。有足够的备用交换机端口可用于在其他地方重新分配布线和重新编程,但是在我们追踪受影响的设备时出现了停机时间。
这是一个新的建筑/仓储设施,服务器机房的设计进行了大量规划。主服务器机房由一台APC SmartUPS RT 8000VA双转换在线 UPS 运行,并由发电机提供支持。所有连接的设备都有适当的电源分配。异地数据复制和系统备份已经到位。
总之,损害(我知道)是:
大多数问题都与丢失 Cisco 4507R-E 中的整个交换机刀片有关。这包含一些 VMware NFS 网络和站点防火墙的上行链路。VMWare 主机出现故障,但一旦存储网络连接恢复,HA 就会处理 VM。我被迫重新启动/重启许多设备以清除时髦的电源状态。所以恢复的时间很短,但我很好奇应该吸取什么教训......
电脑主要需要三种电压才能工作:+12V、+5V和+3,3V,都是DC。
为什么我们不能只用几个(用于冗余)大电源为整个数据中心提供这三种电压,而服务器直接使用它?
这会更有效,因为转换电源总是有损耗,一次执行一次比在每个服务器的 PSU 中每次执行一次更有效。此外,UPS 会更好,因为它们可以使用 12V 电池直接为数据中心的整个 12V 电网供电,而不是将 12V DC 转换为非常低效的 120/240 AC。
我时不时地读到一些数据中心发生严重火灾,大量设备损坏,客户下线。现在我想知道有什么可以支持和传播火力?
我的意思是服务器机房的墙壁通常很少或没有饰面。机架由金属制成。几乎所有单位都有金属外壳。电缆具有(或至少应该具有)不会蔓延火灾的绝缘材料。
什么是在服务器机房或数据中心蔓延的火?
我的事……麻烦。
我所做的在地球上的每个国家都是合法的,但有些人不喜欢它,这对我可怜的 ISP 来说太难了,以至于我不得不比我想要的更频繁地寻找新的提供商。
我所知道的对我这个职位的人来说唯一的选择是“防弹托管”(想想维基解密),而且它并不便宜。
唯一使防弹托管变得昂贵或与典型托管不同的事情是他们在通过电子邮件回应“滥用”投诉时的法律立场。无论出于何种原因,您的典型主持人都会在 5 或 10 后感到厌烦,而防弹主持人会花时间检查此事的合法性并据此做出决定。
据我所知,这些滥用电子邮件与他们服务器所在的 IP 地址直接相关,因为他们“拥有”该 IP 地址,并且能够在我昂贵的防弹服务器上将其出租给我。
如果我可以亲自回答他们,我会为另一家公司省去麻烦,并希望在此过程中为自己节省一些钱。
怎样才能成为防弹主机?只需在我当地的 DC 租一个房间,然后询问从哪里获得 IP?
PS不......只是因为我知道这将是每个人问的第一个问题- 我不是垃圾邮件发送者或规则 34 色情作家,我所做的在每个国家都是合法的。我说“想想维基解密”!
编辑:再次感谢您的所有精彩回复。不知道为什么我最近一直在这里生火。感谢所有看穿烟雾并为我提供有意义答案的人。
datacenter ×10
server-room ×5
hardware ×3
networking ×2
rack ×2
disaster ×1
hosting ×1
ip-address ×1
privacy ×1
rackmount ×1
safety ×1
ups ×1