相关疑难解决方法(0)

硬件 SATA RAID-10 阵列中的单个磁盘如何使整个阵列停止运行?

序幕:

我是一个代码猴子,越来越多地为我的小公司承担系统管理员的职责。我的代码就是我们的产品,而且我们越来越多地提供与 SaaS 相同的应用程序。

大约 18 个月前,我将我们的服务器从一家以优质托管为中心的供应商转移到了 IV 级数据中心的准系统机架推进器。(字面意思是在街对面。)这个人自己做的事情更多——比如网络、存储和监控。

作为重大举措的一部分,为了取代我们从托管公司租用的直连存储,我构建了一个基于 SuperMicro 机箱、3ware RAID 卡、Ubuntu 10.04、两打 SATA 磁盘、DRBD 和 . 三篇博文详细记录了这一切:构建和测试新的 9TB SATA RAID10 NFSv4 NAS:第一部分第二部分第三部分

我们还设置了一个 Cacit 监控系统。最近,我们添加了越来越多的数据点,例如 SMART 值。

我不能这样做这一切,而不真棒 挤入 ServerFault。这是一次有趣且有教育意义的经历。我的老板很高兴(我们节省了大量的美元),我们的客户很高兴(存储成本下降),我很高兴(有趣,有趣,有趣)

直到昨天。

中断和恢复:

午饭后一段时间,我们开始从我们的应用程序(一个按需流媒体 CMS)收到性能缓慢的报告。大约在同一时间,我们的 Cacti 监控系统发送了大量电子邮件。一个更有说服力的警报是 iostat await 的图表。

在此处输入图片说明

性能变得如此下降以至于 Pingdom 开始发送“服务器关闭”通知。整体负载适中,没有流量高峰。

在登录应用服务器、NAS 的 NFS 客户端后,我确认几乎所有东西都在经历高度间歇性和超长的 IO 等待时间。一旦我跳到主要 NAS 节点本身,在尝试导航问题阵列的文件系统时,同样的延迟很明显。

是时候进行故障转移了,一切顺利。在 20 分钟内,一切都被确认备份并完美运行。

验尸:

在任何和所有系统故障后,我都会进行事后分析以确定故障原因。我做的第一件事是 ssh 回到盒子里并开始查看日志。它完全离线。是时候去数据中心旅行了。硬件复位,备份并运行。

/var/syslog我发现这个可怕的条目:

Nov …
Run Code Online (Sandbox Code Playgroud)

performance hard-drive sata sas hardware-raid

107
推荐指数
6
解决办法
2万
查看次数

SAS SFF-8087 分支电缆究竟是如何工作的?+ RAID/连接问题

如果我的问题没有任何意义,请告诉我,因为由于我缺乏这方面的技术知识,我不确定我是否从我的想法中正确解释了它。

如果我使用的主板具有 SFF-8087 至 4x 电缆的连接,例如此SFF-8087 至 4x SATA连接。

我仍在学习 SAS,但被告知要利用这些联系从潜在雇主那里构建一个系统。但是,我只是不确定我是否理解系统将如何处理通过此电缆进入 SAS 端口的 SATA 连接的概念。

另外,与将 SATA 驱动器直接连接到 SATA 主板端口相比,这样做有什么好处?我相信内置的 SAS 连接可能是一个集成的 RAID 控制器。

虽然,是的,我可以继续连接所有适合的电缆,但我想更好地了解我在做什么,例如:

  1. 如果主板具有 SAS 连接,我是否应该自动假设它内置了某种类型的 RAID 控制器,还是视具体情况而定?
  2. 所有 RAID 控制器都只有 SAS 连接吗?
  3. 即使 SATA 驱动器通过 SAS 连接进行连接,它们仍然只是被视为 SATA 驱动器或 SAS 技术吗?

hardware raid storage sata sas

20
推荐指数
1
解决办法
6万
查看次数

标签 统计

sas ×2

sata ×2

hard-drive ×1

hardware ×1

hardware-raid ×1

performance ×1

raid ×1

storage ×1