前几天,我们注意到服务器机房里散发出一股难闻的烧焦味。长话短说,它最终成为 UPS 单元中燃烧的电池模块之一,但我们花了好几个小时才弄明白。我们能够弄清楚的主要原因是UPS显示器最终显示需要更换模块。
问题是:整个房间都充满了气味。进行嗅探测试非常困难,因为气味已经渗透到所有东西中(更不用说它让我们头晕目眩)。我们几乎错误地关闭了我们的生产数据库服务器,因为它是气味最强烈的地方。生命体征似乎没问题(CPU 温度显示为 60 摄氏度,风扇速度正常),但我们不确定。碰巧烧毁的电池模块与机架上的服务器高度相同,仅相距 3 英尺。如果这是真正的紧急情况,我们就会惨败。
实际上,实际服务器硬件烧毁的可能性是相当罕见的,而且大部分时间我们都会将 UPS 视为罪魁祸首。但是有几个机架和几件设备,它很快就会变成一个猜谜游戏。如何快速准确地确定哪一件设备实际上在燃烧?我意识到这个问题高度依赖于环境变量,如房间大小、通风、位置等,但任何输入都将不胜感激。
SSD 驱动器已经存在好几年了。但可靠性问题仍然存在。
我想这是 4 年前发布的这个问题的后续,最后一次更新是在 2011 年。现在是 2013 年,有很大变化吗?我想我正在寻找一些真实的证据,而不仅仅是直觉。也许您正在 DC 中使用它们。你有什么经历?
更新:
现在是 2016 年。我认为答案可能是肯定的(可惜它们每 GB 的成本仍然更高)。
这份报告提供了一些证据:
以及一些关于(消费者)机械驱动器的有趣数据:
有一个服务器从早上 4:30 到 ~ 22:00 使用。
应该关掉吗?我认为它是一个服务器并且它不会有问题,但是严肃的教授告诉我它很危险,并且 HD 可能会在 2 年内失败。服务器所有者认为,他的旧服务器从 1995 年开始运行,没有备份,只有一个硬盘(如果硬盘坏了,他就拧紧)没有问题,因为他过去常常在晚上关闭它。
你相信什么?
现在它有一个 RAID 1 阵列、外部硬盘备份以及 DVD 和 Internet 上的多个完整硬盘备份。
问题
我已经阅读了很多关于存储的讨论,以及 SSD 还是经典 HDD 更好。我很困惑。HDD 仍然很受欢迎,但为什么呢?
哪个更适合主动存储?例如对于数据库,磁盘一直处于活动状态?
关于固态硬盘。
优点。
缺点。
题。
关于硬盘。
优点。
缺点。
仅仅是价格吗?为什么首选硬盘驱动器?SSD 真的对服务器有用吗?
是否有任何研究或证据表明,在设备的使用寿命内,水平安装硬盘驱动器比垂直安装更好?或颠倒,或任何方向。
假设我有一个机架,里面有几台服务器和其他东西。其中一台服务器严重过热,并且在附近有一名维修人员时开始冒烟或着火。
如果在公寓中发生类似情况并且附近有灭火器,则立即使用灭火器通常可以非常快速地灭火,但如果服务器机架不正确灭火可能会对周围设备造成不必要的额外损坏。
澄清一下,我说的是一场非常小的火灾,人们可以在不冒生命危险的情况下尝试扑灭它——比如拿起附近的灭火器,将其排放,然后在 15 秒内将火扑灭。
扑灭服务器机架中的小型局部火灾的策略是什么?要使用什么类型的灭火器?如何尽量减少对周边设备的损坏?
这是我的场景:我是一名开发人员,继承了(我不知道)位于我办公室内的三台服务器。我还继承了服务器管理员的工作,但明显缺乏服务器管理知识,并以 google / ServerFault 作为参考点。幸运的是,我实际上从未真正需要与机器接触或解决任何问题,因为它们总是“正常工作”。
所有三台机器都位于同一个数据室内,用于以下目的:
Machine1- IIS 8.0 托管了许多内部应用程序
Machine2- SQL Server 2008 R2 用于内部应用程序的数据存储
Machine3- SQL Server 2008 R2 镜像存储Machine2
所有三个都连接了外部硬盘驱动器,可以经常完成备份。
我被告知所有三个都需要从一个数据室移动到同一处所内的另一个数据室。我不会完成硬件的物理移动,这将由有能力的搬运工处理。
除了完成每个备份的完整备份之外,在假设轻弹电源开关并观看我的世界移动之前,我需要考虑哪些因素?
我知道将所有三个都位于同一个房间/场所远非理想,但这已经超出了这个问题的范围。
由于我不是硬件专家,因此我不知道网络交换机具有哪些特性才能成为良好的网络交换机。当我比较不同厂商的不同型号时,我应该注意什么?
多年来,我不得不扔掉不少计算设备(等等):
(这是除了各种笔记本电脑和打印机以与此问题无关的方式死亡之外。)
显然,从这么少的信息中无法确定,但这可能与电源问题有关吗?我目前没有任何此类设备的 UPS。电涌保护组插座上的所有东西,但没有什么可以平滑断电。
家用 UPS 真的可行和有用吗?我知道市场上有一些相当便宜的 UPS,但我不知道它们到底有多大用处。我对在断电期间保持家庭网络实际运行不感兴趣,但如果当前情况使我的硬件处于危险之中,我希望它更优雅地断电。
DIMM 的“等级”对服务器内存有何不同?例如,在查看服务器配置时,我看到为同一服务器提供以下内容:
2GB (1x2GB) Single Rank PC3-10600 CL9 ECC DDR3-1333 VLP RDIMM
2GB (1x2GB) Dual Rank PC3-10600 CL9 ECC DDR3-1333 VLP RDIMM
Run Code Online (Sandbox Code Playgroud)
鉴于单列与双列或双列与四列的选项总是一个:
确保在每个通道中填充具有适当数量的 DIMM 以获得最佳性能非常重要。只要有可能,建议在系统中使用双列 DIMM。双列 DIMM 提供更好的交错,因此比单列 DIMM 具有更好的性能。
例如,在 SPECjbb2005 中,装有 6 个 2GB 双列 DIMM 的系统的性能比装有 6 个 2GB 单列 DIMM 的系统高 7%。双列 DIMM 也优于四列 DIMM,因为四列 DIMM 会导致内存速度降低。
另一个重要的准则是为每个通道填充等效的等级。例如,应避免在一个通道中混合使用一个单列 DIMM 和一个双列 DIMM。
最终,内存列数的影响是特定于每个服务器/芯片组的。例如,在 IBM 的 x3850X5 服务器上,等级越高越好(参见 §3.8.4):
借助 x3850 X5 中的至强 7500/6500 …
hardware ×10
hard-drive ×2
ssd ×2
storage ×2
datacenter ×1
lifecycle ×1
memory ×1
networking ×1
rack ×1
sas ×1
sata ×1
server-room ×1
switch ×1
ups ×1