在我开始之前,快速免责声明。我基本上是一个因环境而被迫担任系统管理员角色的开发人员,所以如果我说一些愚蠢的话或看起来我不知道自己在做什么,我会提前道歉。
因此,我们的主服务器上的硬盘之一出现了问题。/dev/sda有两个分区,一个挂载为/,另一个用作 PostgreSQL 数据驱动器 ( /dev/sda2)。
$ df -h
Filesystem Size Used Avail Use% Mounted on
rootfs 92G 13G 75G 14% /
udev 10M 0 10M 0% /dev
tmpfs 1.6G 12M 1.6G 1% /run
/dev/disk/by-uuid/8ffca87a-ffe4-4c39-ab30-352b61f039f8 92G 13G 75G 14% /
tmpfs 5.0M 0 5.0M 0% /run/lock
tmpfs 3.2G 0 3.2G 0% /run/shm
/dev/sda2 826G 66G 719G 9% /var/lib/data/vol1
/dev/sdb1 917G 75G 797G 9% /var/lib/data/vol2
Run Code Online (Sandbox Code Playgroud)
(/dev/sda1 出于某种原因使用其 UUID 挂载)
最近,它开始经历 100% IO R/W 的间隔,在此期间系统实际上被阻塞并且无法执行最简单的任务。
dmesg 的简短摘录: …