嗯……我的服务器里住着一个鬼魂

tsg*_*nis 4 ibm

你好,来自希腊的每一个人和问候

我有一个相当不寻常的情况,我的想法不多了。我有这台旧服务器(IBM x205 - P4 2.4Ghz,3xSCSI 36gb),大约一年前我决定将它用作额外的域控制器以及传真和文件服务器。对于这个任务,我有一个 Delock 70154 SATA 卡和 2x320 SATA II HDD

直到大约 3 周前,一切都非常顺利。我正在旅行中,回来时被告知服务器被冻结。好吧,我认为这是一个小故障,因为简单的断电/通电修复了一切。同样,两周前又一次冻结情况。它变得可疑,但在断电/通电后,一切都在运行。

它再次冻结,当我启动它时,它出现了一条消息,指出由于 NTDS 损坏,域服务无法启动。以安全模式启动显示 SATA Raid(降级)存在问题。

经过大量搜索后,我降级了服务器,清理了 Active Directory,拔出两个硬盘(其中一个真的很糟糕)并恢复了我的文件(我在 ho Delock 处理冗余硬盘时遇到了一些问题)。

现在我的服务器很简单,只有工厂安装的东西。这就是乐趣开始的地方。每天当我到达办公室时,我都会发现这台特定的机器死了,我的意思是完全死了。只是黑屏,没有别的。CPU 风扇工作,PSU 工作。键盘和鼠标都死了(它们也锁定了我的 KVM)和网络一样。机器死了。

我强行关闭电源,然后打开电源。在我在办公室的 8 个小时里,它可以正常工作,要么空闲,要么运行某种诊断程序。当我离开办公室时,一段时间后(可能是 30 分钟后,也可能是 4 小时后),机器死机了。这是事件日志显示的信息

"the previous shutdown at xx:xx:xx was unexpected"
Run Code Online (Sandbox Code Playgroud)

我尝试了以下操作: Memtest:没有显示 Passmark 测试中的刻录:没有显示 仔细研究事件日志:我看不到任何感兴趣的内容 将选项设置为崩溃后不自动启动,以便我可以看到 BSOD:没有查看电源方案设置为永不休眠。

我知道还有很多其他工具对像 OCCT 这样的机器造成很大压力,但机器很旧。尽管如此,今天我还是要尝试一下。一个想法是重新格式化它,但我真的很想找出导致这种情况的原因,因为我可能会遇到这样的情况,即一切都可以正常工作一段时间,然后卡布姆,有一天它又要死了。我真的需要伸出援手,欢迎每一个意见/想法。我知道显而易见的解决方案是永远不要离开办公室,但我还有生活。对不起服务器。:)

PS 这种机器死机的情况已经持续了大约一个星期。每天我都会设置 RAID 重建或复制/恢复文件,而everythig 正在工作

Jas*_*erg 6

听起来像一个非常老的服务器。听起来也像是在缓慢而痛苦地死去。大多数 IT 部门在一段时间后更换硬件是有原因的。原因是因为支持旧硬件需要花费太多的钱。我敢打赌,您拥有的服务器已有 6-8 年的历史了。摆脱它。它会比它的价值更麻烦。您可能有一个坏主板或一个坏处理器。您可能找不到任何一个新零件,因此您必须购买二手零件。对于使用过的部件,您不知道是否给服务器带来了新问题。就像我说的,摆脱它。您将不得不投入其中的努力/时间/金钱是不值得的。

  • @tmow 保留过期的旧硬件,从而浪费生命和雇主的时间,这是一种罪过。这对一个人的职业生涯和雇主的生计都是一种危险。压力更大的人意味着更多的物质用于管理压力和更成问题的关系。垃圾堆中的服务器对环境的影响要小于一个人或整个陷入困境的公司。 (2认同)