小编Bot*_*Net的帖子

确定 30 分钟后 SSD 故障的原因

我们在与本地托管公司合作的塔式服务器中有一个 64GB SSD 驱动器。这个驱动器和输入系统是大约六个月前建造的，全新的部件。

直到本周末，SSD/系统都运行良好。我们正在运行 CentOS 6.2

完美启动后，系统可以使用大约 20-30 分钟（与时间没有真正的一致性），然后驱动器开始变得有趣。

图书馆开始说他们无法加载，ssh 开始拒绝公钥登录。关机开始说“输入/输出错误”。一些程序开始指示驱动器是只读的。

仅使用了 64GB 中的 25GB。

我找不到任何表明发生了什么的错误。我尝试从驱动器上的 live cd 运行 fsck 并且它没有显示任何问题并且大多数时间启动工作正常。有一个引导说“找不到操作系统”，但这种情况不再发生了。

我在哪里可以找到有关发生情况的日志？我还应该做其他磁盘检查吗？这似乎是一个可修复的问题，而不是我需要一个新驱动器。

更新：

我在重新启动服务器后启用了 SMART。经过 1 小时的正常运行时间和系统正常运行（正在运行的服务是 httpd、mysql，但几乎没有流量），突然事情就停止了。在正常运行的一小时内，它通过智能健康检查的 PASS 做出响应。一小时后我再次尝试（通过 webmin），现在它说 SMART 已禁用。

硬盘驱动器现在显示了我以前见过的相同问题 - 尝试大多数命令显示“输入/输出错误”。

现在运行智能健康检查显示：

Log Sense failed, IE page [scsi response fails sanity test]

Run Code Online (Sandbox Code Playgroud)

我能做些什么来找出是什么导致随机一段时间后失败？它完美地运行了 30-60 分钟，然后它开始像这样奇怪。

更新 2

有些人要求我尝试 dmesg，结果如下：http : //www.pastie.org/private/hk7jfhxilj7ypy828irna。其他人建议我不要假设它是驱动器，而可能是驱动器控制器。我不明白如何确定错误是控制器还是驱动器 - 除了尝试不同的驱动器。如果我必须购买更换主板或驱动器，我需要知道哪个首先出现故障。

运行 fsck 显示：

fsck from util-linux-ng 2.17.2
e2fsck 1.41.12 (17-May-2010)
fsck.ext4: Superblock invalid, trying backup blocks...
fsck.ext4: Bad magic …

Run Code Online (Sandbox Code Playgroud)

ssd

Bot*_*Net

2012 04-24

1
推荐指数

2
解决办法

2668
查看次数

标签统计

ssd ×1

确定 30 分钟后 SSD 故障的原因

标签 统计

小编Bot_Net的帖子

标签统计