我们最近注意到我们的数据库查询运行时间比平时长得多。经过一些调查,看起来我们的磁盘读取速度非常慢。
过去我们遇到过类似的问题,由 RAID 控制器在 BBU 上启动重新学习周期并切换到直写。这次似乎不是这样。
我在bonnie++几天内跑了几次。结果如下:
22-82 M/s 的读取速度似乎非常糟糕。dd在原始设备上运行几分钟,显示读取速度为 15.8 MB/s 到 225 MB/s(请参阅下面的更新)。iotop并不表示有任何其他进程在竞争 IO,所以我不确定为什么读取速度如此可变。
RAID 卡是 MegaRAID SAS 9280,具有 RAID10 中的 12 个 SAS 驱动器(15k,300GB)和 XFS 文件系统(在 RAID1 中配置的两个 SSD 上的操作系统)。我没有看到任何 SMART 警报,阵列似乎也没有降级。
我也运行过xfs_check,似乎没有任何 XFS 一致性问题。
接下来的调查步骤应该是什么?
Ubuntu 12.04.5 LTS
128GB RAM
Intel(R) Xeon(R) CPU E5-2643 0 @ 3.30GHz
Run Code Online (Sandbox Code Playgroud)
的输出xfs_repair -n:
Phase 1 - find and verify superblock...
Phase 2 - using internal log
- …Run Code Online (Sandbox Code Playgroud)