为什么未分区的 Hitachi HDS5C3020 驱动器在启动 15 分钟后开始消耗 50% 以上的电量?

Pro*_*kup 19 hard-drive electrical-power smart debian-squeeze

在 Debian 6.0.6 系统中,有 74 个 2TB Toshiba DT01ABA200 驱动器。这些驱动器被标识为运行固件版本 MZ4OAAB0 的 Hitachi HDS5C3020BLE630 驱动器。64 个驱动器通过 HP SAS 扩展卡连接到 LSI 2008 SAS 控制器,另外 5 个驱动器直接连接到主板,4 个驱动器连接到基于 Sil 的 PCI 控制器,最后一个驱动器仅通电且未连接数据线。控制器 LSI 和 Sil 卡的板载 BIOS 均已禁用,并且 mpt2sas 和 sata_sil 模块已从 Linux debian 2.6.32-5-amd64 #1 SMP Sun Sep 23 10:07:46 UTC 2012 x86_64 GNU/Linux 内核中删除。mpt2sas 模块在启动后使用 /etc/rc.local 中的 modprobe 命令加载。这 74 个驱动器没有分区,没有格式化,也没有挂载。

系统消耗:

  • 0的驱动器:70.6 - 70.9瓦特(也15分钟后启动);
  • 74个驱动:330 - 360瓦特,只是开机后(相当于3.5 -每个在空闲状态下驱动3.9W);
  • 使用74 个驱动器:420 - 466 瓦,每次在正常运行时间的第 15 分钟(相当于空闲状态下每个驱动器 4.7 - 5.3W)。

驱动器规格列出 4.7W 为读/写,3.3W 为空闲功耗。

增加的功耗最有可能发生在 5V 线路上,因为大约 1 分钟后,电源 (PSU) 的“过流保护”(OCP) 会关闭电源。使用的 PSU 是单轨型号,12V 线路上的 OCP > 122A,5V 线路上 > 55A。

回归:

  • 驱动器的 APM 值设置为禁用还是 1(最大节能)并不重要。
  • 操作系统在 中没有记录读/写活动/proc/diskstats。那里的值与 modprobe 操作之后立即相同(28 次读取,0 次写入操作)。
  • 无法测试启动到主板时会发生什么,它的 BIOS - 排除任何操作系统干预 - 因为运行固件 06/27/12 的 Super Micro X8SI6-F 主板有一个错误,错误地将 +74.0 C CPU 传感器温度读取为“ BIOS 模式下为 High”,并在 1 分钟后关闭电源。

什么可能导致启动后第 15 分钟内所有驱动器上的驱动器读/写活动以及如何防止它发生?

Chr*_*s S 20

听起来很像驱动器正在执行智能清理(自动离线测试)。

smartctl -a /dev/hdx
Run Code Online (Sandbox Code Playgroud)

应确认配置:

Auto Offline Data Collection: Enabled.
Run Code Online (Sandbox Code Playgroud)

禁用:

smartctl --offlineauto=off /dev/hdx
Run Code Online (Sandbox Code Playgroud)

也可能是别的东西...